2024-10-01から1ヶ月間の記事一覧

Pandas CSV行番号、列番号でデータを取得する

DataFrame [] スライスで取得したい行を取得 取得した DataFrame の values で numpy.ndarray を取得して、 (values取得で多次元配列 ndarray は、2次元配列だから[0]で1行分を取得) tolist() でリストに変換例)注意:CSV先頭行はヘッダ行で、データ行…

Pandas を使って重複のあるCSVから重複行を取り除いたCSVを生成する

任意の列項目で重複があるCSV 先日のサンプル ⇒ Pandas を使ってcsv 任意の列で重複するキーの組み合わせを求める。 - Oboe吹きプログラマの黙示録 にあるようなCSVから、 重複行を取り除いたCSVを生成する。DataFrame に対して drop_duplicates(subset=[ 重…

pandas を使った重複有無の判定

先日書いたのは、CSVでどのような重複があるかを調査するものだった。 Pandas を使ってcsv 任意の列で重複するキーの組み合わせを求める。 - Oboe吹きプログラマの黙示録重複有無のだけを判定する方法をまとめた。先日の Pandas を使ってcsv 任意の列で重複…

Pandas を使ってcsv 任意の列で重複するキーの組み合わせを求める。

サンプルのCSV 品名 産地 単価 数量 キャベツ 群馬県 219 120 コシヒカリ 新潟県 3350 20 小松菜 茨城県 198 40 キャベツ 群馬県 209 80 りんご 長野県 224 100 小松菜 茨城県 188 90 キャベツ 神奈川県 210 70 キャベツ 群馬県 224 100 '品名'と'産地'が重…

DBeaver CSVエクスポート時にBOMを付与

DBeaver というツールを使って、テーブルやSQLクエリ結果を CSVにエクスポート出力する時に、UTF-8 文字コードで出力する時、 BOMを付与するには、以下のようにエクスポート実行画面で BOMを挿入にチェックをつける