Pythonで機械学習などのプログラミングをするときには、まずはデータセットの用意が必要で、csvファイルで用意することも多いと思います。
csvファイルの読み込みには、numpyのloadtxt関数を使うと便利だと思います。今回は、loadtxtのパラメータ設定の中から必要最低限覚えておくと便利だと思ったものをピックアップしてご紹介します。

スポンサーリンク

loadtxt関数でdelimiterに","を設定してcsvファイルを読み込む

データがfloat型で、1行目からデータが開始するという前提であれば、delimiterに","を設定してdtypeをfloat型に設定すればOKです。
下記のようにシンプルに書けます。

csvファイルを読み込むPythonのサンプルコード

Pythonのサンプルコードになります。
例えば、in.csvには、カンマ区切りで数値が並んでいます。

numpyのモジュールをimportして、loadtxt関数で下記のように書いてin.csvを読み込みます。
delimiterは","の設定、dtypeはfloat型に設定しています。
読み込んだ後に、読み込んだデータをprint出力しています。

実行すると下記のように、npArrayにcsvファイルのデータが格納されているのが確認できます。

スポンサーリンク

パラメータusecolsで読み込む列を指定

パラメータusecolsに読み込む列を指定することができます。

例えば、下記のようにcsv形式でin.txtがあったとします。

下記がサンプルコードになります。

下記が実行結果になります。

savetxtで、numpy配列をcsv形式でファイル出力する方法

savetxtでnumpy配列をファイル出力することができます。
下記がサンプルコードになります。csv形式の出力なのでdelimiter = ","を指定しています。

下記が実行結果になります。
out.txtには、csv形式でnumpy配列のデータが書き込まれているのが確認できます。

エンジニアのスキルを活かして、理想の働き方を求めていこう

エンジニアとして新しい働き方を求める方へ、MIDWORKS

MIDWORKSは、週3日から可能な案件も紹介していて、フレキシブルな働き方を求めるにとってはおすすめです。

MIDWORKS

MIDWORKSでは、万が一仕事が途切れてしまった場合の給与保証制度があります。 給与保証制度を適用している場合は、仕事が見つからなかった時に月額契約単価の80%を日割りで受け取ることができます。
安定した収入を求めるフリーランスにとっては、安心して案件を探すことができると言えます。

MIDWORKSに無料会員登録する

開発言語に応じた案件を探すことができるので、 自身のスキルアップの機会として、案件を探すのも有効な手だと思います。

スポンサーリンク