スポンサーリンク

kerasのTokenizerでリストをndarrayで表現(ベクトル化)

参考:kerasのTokenizerでテキスト(文字列)リストをベクトル化

下記のようにリストを定義します。

Tokenizerをimportして、

sequences_to_matrix()で、リストをndarrayで表現します。

tokenNumは下記のようなndarrayになります。

例えば、1行目の[[0. 1. 1. 1. 0. 0. 0. 0. 0. 0.]を見てみると、
[1, 2, 3]は、1と2と3が使われているので、1列目と2列目と3列目が、1となっています。
mode='binary'を指定しているので0 or 1 で表現されますね。

スポンサーリンク

サンプルコード

下記がサンプルコードになります。

下記が実行結果になります。

スポンサーリンク