とあるサイトを PDF に保存した。今思えば先のことを考えていなかった。 データを活用しようと思ったが、PDF のままでは無理と気づく。 そこで Python を使って文字を取り出すことにした。 ネットで調べると pypdf というライブラリーに関する記述が多かった ...
スクレイピングで収集したデータや、計算処理の結果を保存する際、最も手軽で汎用性が高いのがCSVファイル形式です。Excelで開くことができ、データベースへのインポートも容易なため、実務においてもデファクトスタンダードとして利用されています。
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する