netさんのブログラム

自分へのメモを含めたITのんびりブログ

Excelとpython(parse_colsに注意,正解はusecols)

Excelpythonでデータの整形時にハマったので,書いておきます.

 

まずはポイント

parse_cols は使わない.現在ライブラリ上で非推奨になっています.

usecols を使いましょう.

 

どんたところで詰まったのかと言うと.

 

1.ファイルの指定シートを読み込みます.

2.読み込んだシートのいらない行を削り,必要な列を残します.

 

サンプル

こんな表があります(材料は政府統計のページから)

f:id:net9999:20200216190122p:plain

サンプル(表)

まぁなんて言うんですかね・・・

これをデータとして使うのは大変だなーと思います.

これを作るためのDBの情報をそのまま出してくれないかなと

 

とりあえず,こんなことしたい.

6行目まで削除

1列目を削除

 

と言うことでハマりました.

まずは結果

f:id:net9999:20200216192139p:plain

整頓結果

こうなりました.

多少は使いやすくなったかも

 

で,ハマった理由は

 

f:id:net9999:20200216192448p:plain

コード

コメントのところですが,繰り返し書いておきます.

 

parse_cols は使わない.現在ライブラリ上で非推奨になっています.

usecols を使いましょう.

 

環境にも依存すると思いますが,私の環境では,parse_colsは動きませんでした.

列が消えないなーと思いながら,数時間わかりませんでした.

 

この辺り注意ですね.