Pythonで機械学習などのプログラミングをするときには、まずはデータセットの用意が必要で、csvファイルで用意することも多いと思います。
csvファイルの読み込みには、numpyのloadtxt関数を使うと便利だと思います。今回は、loadtxtのパラメータ設定の中から必要最低限覚えておくと便利だと思ったものをピックアップしてご紹介します。

スポンサーリンク

loadtxt関数でdelimiterに”,”を設定してcsvファイルを読み込む

データがfloat型で、1行目からデータが開始するという前提であれば、delimiterに”,”を設定してdtypeをfloat型に設定すればOKです。
下記のようにシンプルに書けます。

csvファイルを読み込むPythonのサンプルコード

Pythonのサンプルコードになります。
例えば、in.csvには、カンマ区切りで数値が並んでいます。

numpyのモジュールをimportして、loadtxt関数で下記のように書いてin.csvを読み込みます。
delimiterは”,”の設定、dtypeはfloat型に設定しています。
読み込んだ後に、読み込んだデータをprint出力しています。

実行すると下記のように、npArrayにcsvファイルのデータが格納されているのが確認できます。

スポンサーリンク

パラメータusecolsで読み込む列を指定

パラメータusecolsに読み込む列を指定することができます。

例えば、下記のようにcsv形式でin.txtがあったとします。

下記がサンプルコードになります。

下記が実行結果になります。

savetxtで、numpy配列をcsv形式でファイル出力する方法

savetxtでnumpy配列をファイル出力することができます。
下記がサンプルコードになります。csv形式の出力なのでdelimiter = “,”を指定しています。

下記が実行結果になります。
out.txtには、csv形式でnumpy配列のデータが書き込まれているのが確認できます。

スポンサーリンク