iOS 12 の CoreML 2.0 は自分で機械学習モデルを訓練できますか？

CoreML 2.0 はカスタムモデルに対応しており、自分でモデルを訓練することが可能です。TextClassiferPlayground のようなサードパーティツールを使ってデータを準備し、テキスト分類モデルを訓練できます。訓練が完了したら、そのまま iOS プロジェクトにインポートして使用できます。これにより機械学習の敷居が下がり、実装が非常に簡単になります。

CoreML のテキスト分類訓練用データはどう準備すればいいですか？

テキスト分類のデータは、入力テキストと対応する分類ラベルを含む必要があり、通常は JSON または CSV 形式です。記事では Phpmyadmin を使って MySQL からデータをエクスポートし、テキストと分類だけを含む JSON 配列に整形しています。このような構造は訓練ツールが読み込みやすく、機械学習に適しています。

CoreML でテキスト分類モデルを訓練する際、どうやって形態素解析（単語分割）を行いますか？

訓練前にテキスト内容を形態素解析し、文を単語に分割します。例えば「我想知道婚禮需要準備什麼」は「我想, 知道, 婚禮, 需要, 準備, 什麼」のように分けます。単語分割はモデルが意味をより正確に解析し、分類精度を向上させるのに役立ちます。iOS では NSLinguisticTagger を使って形態素解析が可能です。

CoreML モデルの訓練が終わったら、どうやって iOS プロジェクトに取り込んで使いますか？

訓練済みの CoreML モデルファイル（.mlmodel）を Xcode プロジェクトにドラッグ＆ドロップするだけで使用可能です。その後、Swift でモデルクラスの prediction メソッドを呼び出し、テキストを入力すると分類結果が得られます。全体の流れがシンプルで、アプリ内に直接統合できます。

なぜ自分で訓練した CoreML のテキスト分類モデルの予測精度が約 35% しかないのですか？

予測精度が低い原因は、訓練データの量が少なすぎるためです。記事では約 100 件のデータを使っており、実験的な規模です。データ量が不足するとモデルが十分な特徴を学習できず、精度が下がります。訓練データを増やし、分類ラベルの品質も調整することで精度向上が期待できます。

CoreML は iOS デバイス上で直接モデルを訓練できますか？

現時点では CoreML は iOS デバイス上で直接モデルを訓練することをサポートしていません。モデルの訓練は MacOS 上でツールを使って行い、訓練済みモデルを iOS アプリにインポートして予測に利用します。これが現段階での CoreML の制限です。

CoreML のテキスト分類モデルを簡単に訓練できる便利なツールはありますか？

Apple 公式では画像分類の GUI 訓練ツールのみ提供しており、テキスト分類は自分でコードを書くかサードパーティツールを使う必要があります。記事では GitHub の TextClassiferPlayground を推奨しており、GUI インターフェースで JSON データを読み込み、テキスト分類モデルを簡単に訓練できるため、訓練プロセスが直感的になります。

CoreMLで記事分類を自動予測｜iOS 12でモデル自作＆活用法を徹底解説

iOS 12 CoreML を試す — 機械学習で記事の分類を自動予測、モデルも自分でトレーニング！

CoreML 2.0を探る：モデルの変換やトレーニング、そして実際の製品への応用方法

前回の記事上一篇に続き、iOSでの機械学習の研究について、本稿では正式にCoreMLの使用に入ります。

まず歴史を簡単に説明します。Appleは2017年にCoreML（前回の記事で紹介したVisionを含む）機械学習フレームワークを発表しました。2018年にはCoreML 2.0をリリースし、性能向上に加え、カスタムCoreMLモデルのサポートも実現しました。

はじめに

もし「機械学習」という言葉を聞いたことはあっても意味がよく分からない場合、ここでは一言で簡単に説明します：

「過去の経験に基づいて、同じ出来事の未来の結果を予測する」

例えば：私は卵クレープにケチャップをかけます。何度か買ううちに、朝食店の店主の奥さんが覚えてくれて、「イケメン、ケチャップ入れる？」と聞いてきます。私が「はい」と答えると、店主の奥さんの予測は正しいです。もし「いいえ、なぜなら大根餅＋卵クレープだから」と答えた場合、店主の奥さんは覚えていて、次回同じ状況で修正します。

入力データ：蛋餅、チーズ蛋餅、蛋餅+大根餅、大根餅、卵

出力データ：ケチャップをかける／かけない

モデル：女将の記憶と判断

実は機械学習については、概念や理論を知っているだけで、実際に深く理解したことはありません。間違いがあれば、どうぞご指導ください。

ここでついでにAppleの神様にお参り🛐したいです。機械学習を製品化し、基本的な概念さえわかれば操作でき、大量の知識がなくても始められるので、敷居が低くなっています。私自身もこのサンプルを実装して初めて、機械学習に触れている実感を持ち、この分野に大きな興味を持ちました。

開始

第一歩で最も重要なのは、前述した「モデル」です。モデルはどこから来るのでしょうか？

三つの方法があります：

ネットで他人が訓練したモデルを探してCoreML形式に変換する

Awesome-CoreML-Models このGitHubプロジェクトは、多くの他人が訓練したモデルを集めています。

モデル変換については公式サイトやオンライン資料を参照してください。

アップルのMachine Learning公式サイトの一番下にある「Download Core ML Models」から、アップルがトレーニングしたモデルをダウンロードできます（主に学習やテスト用です）。
ツールを使って自分でモデルを訓練🏆

では、何ができるのか？

画像認識 🏆
テキスト内容分類🏆
テキストの分割
言語判定
名詞認識

単語分割については、iOSアプリで自然言語処理を行う：NSLinguisticTagger入門を参照してください。

今日の主なポイント — 文章内容の分類＋自分でモデルを訓練

簡単に言うと、私たちは機械に「テキスト内容」と「分類」を与えて、将来のデータを分類するように学習させます。例えば：「最新の割引を見るにはクリック！」、「1000$ショッピングクレジットをすぐに受け取る」=>「広告」；「Alanがあなたにメッセージを送信しました」、「あなたのアカウントがまもなく期限切れになります」=>「重要事項」

実際の応用：迷惑メール判別、ラベル生成、分類予測

p.s 画像認識については、何を訓練すれば良いかまだ思いついていないので、調べていません。興味がある方はこちらをご覧ください。公式で画像のGUI訓練ツールが提供されていて、とても便利です！！

必要なツール： MacOS Mojave以上 + Xcode 10

訓練ツール： BlankSpace007/TextClassiferPlayground （公式は画像用のGUI訓練ツールのみ提供しており、テキスト用は自作が必要です；これはネットの有志が提供するサードパーティーツールです）

トレーニングデータの準備：

データ構造は上図の通りで、.json、.csvファイルに対応しています

データ構造は上図の通りで、.json と .csv ファイルをサポートしています。

訓練用のデータを準備します。ここではPhpmyadmin（Mysql）を使って訓練データをエクスポートします。

SELECT `title` AS `text`,`type` AS `label` FROM `posts` WHERE `status` = '1'

エクスポート形式をJSONに変更

エクスポート形式をJSONフォーマットに変更する

[
  {"type":"header","version":"4.7.5","comment":"PHPMyAdmin用JSONエクスポートプラグイン"},
  {"type":"database","name":"db"},
  {"type":"table","name":"posts","database":"db","data":
    //以上削除
    [
      {
         "label":"",
         "text":""
      }
    ]
    //以下削除
  }
]

ダウンロードしたJSONファイルを開き、中央のDATA構造の内容だけを残します。

訓練ツールの使用：

トレーニングツールをダウンロードしたら、TextClassifer.playground をクリックしてPlaygroundを開きます。

赤枠をクリックして実行 -> 緑枠をクリックしてビュー表示を切り替え

赤い枠をクリックして実行 -> 緑の枠をクリックしてView表示を切り替え

JSONファイルをGUIツールにドラッグ

JSONファイルをGUIツールにドラッグ＆ドロップする

下のコンソールを開いてトレーニングの進行状況を確認し、「テスト正確率」という行が表示されたらモデルのトレーニングが完了したことを示します

下のコンソールを開いてトレーニングの進行状況を確認してください。「テスト正解率」という行が表示されたら、モデルのトレーニングが完了したことを意味します。

データが多すぎると、パソコンの処理能力が試されます。

基本情報を入力後、「保存」を押す

基本情報を入力した後、「保存」を押してください。

訓練済みのモデルファイルを保存する

CoreML モデルファイル

ここまででモデルの訓練は完了です！とても簡単ですよね。

具体的なトレーニング方法：

まず入力された文章を分かち書きします（例：「我想知道婚禮需要準備什麼」→「我想」「知道」「婚禮」「需要」「準備」「什麼」）。その後、その分類をもとに一連の機械学習処理を行います。
訓練データをグループ分けします。例えば、80%を訓練用に、残りの20%をテスト・検証用に使用します。

ここまででほとんどの作業が完了しました。あとはモデルファイルをiOSプロジェクトに追加し、数行のコードを書くだけです。

![モデルファイル(.mlmodel) をプロジェクトにドラッグ＆ドロップ/追加](/assets/793bf2cdda0f/14Uc1elBmhEnQ-J8z_RIQHQ.webp){: loading=”lazy” decoding=”async” width=”1200” height=”712” lqip=”data:image/svg+xml;base64,PHN2ZyB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciIHdpZHRoPSIxMjAwIiBoZWlnaHQ9IjcxMiI+PHJlY3Qgd2lkdGg9IjEwMCUiIGhlaWdodD0iMTAwJSIgZmlsbD0iI2VkZTJjZiIvPjwvc3ZnPg==” data-orig=”/assets/793bf2cdda0f/1*4Uc1elBmhEnQ-J8z_RIQHQ.png” }

モデルファイル（*.mlmodel）をドラッグ＆ドロップまたはプロジェクトに追加する

プログラム部分：

import CoreML

//
if #available(iOS 12.0, *),let prediction = try? textClassifier().prediction(text: "予測したいテキスト内容") {
    let type = prediction.label
    print("私はこれだと思います...\(type)")
}

完成しました！

探索すべき課題：

再学習はサポートされていますか？
mlmodelモデルファイルを他のプラットフォームに変換できますか？
iOS上でモデルを訓練できますか？

以上の三点について、現在確認した情報ではすべて不可能です。

結論：

現在、実務用のアプリで記事投稿時に分類を予測するために利用しています。

結婚吧APP

訓練データは約100件しかなく、現在の予測精度は約35％で、主に実験的なものです。

— — — — —

これで簡単に、人生で初めての機械学習プロジェクトを完成しました。背景でどのように動作しているかはまだ学ぶことがたくさんありますが、このプロジェクトが皆さんの参考になれば幸いです！

参考資料： WWDC2018のCreate ML(2)

Post Mediumから変換 by ZMediumToMarkdown.

CoreMLで記事分類を自動予測｜iOS 12でモデル自作＆活用法を徹底解説

iOS 12 CoreML を試す — 機械学習で記事の分類を自動予測、モデルも自分でトレーニング！

はじめに

開始

では、何ができるのか？

今日の主なポイント — 文章内容の分類＋自分でモデルを訓練

トレーニングデータの準備：

訓練ツールの使用：

プログラム部分：

探索すべき課題：

結論：

ZhgChgLi

コメント

iOS 12 CoreML を試す — 機械学習で記事の分類を自動予測、モデルも自分でトレーニング！

はじめに

開始

では、何ができるのか？

今日の主なポイント — 文章内容の分類＋ 自分でモデルを訓練

トレーニングデータの準備：

訓練ツールの使用：

プログラム部分：

探索すべき課題：

結論：

ZhgChgLi

コメント

こちらもおすすめ

Google Apps Script Web App｜GitHub Actions連携で無料CI/CD打包ツール構築｜跨團隊共有を実現

GitHub Actions｜Self-hosted Runner：CI/CD 実践ガイドで自動化効率最大化

Mediumで1000フォロワー達成｜7年間の継続が生んだ信頼と影響力

今日の主なポイント — 文章内容の分類＋自分でモデルを訓練