💻 ITパスポート | テクノロジ系
転移学習とは?
大量データで訓練済みのAIモデルを「使い回して」、少ないデータで新しいタスクに活用する技術。
🎬 こんなシーンを想像
医療スタートアップがX線画像でがん診断AIを作りたい。でも学習データは数百枚しかない。ゼロから訓練するには
数十万枚のデータと膨大なコストが必要…。
…少ないデータでも精度の高いAIを作れないの?
既存の大規模モデル(ImageNet等で学習済み)の「知識」を流用するのが転移学習。
🧠 転移学習の仕組み
特徴抽出層(エッジ検出・形状認識など)はそのまま使い回し、最後の出力層だけ新しいタスク向けに学習し直す。データが少なくてもコストが安くても、高精度を実現できる。
🔄 転移学習の手順
① 事前学習済みモデルを選ぶ
大規模データセット(ImageNet、GPTなど)で訓練済みのモデルを入手。
▼
② ファインチューニング(微調整)
新しいタスクの少量データを使い、出力層(または一部の層)を再学習させる。
▼
③ 新タスクで高精度を実現
少ないデータ・短い学習時間で、ゼロから訓練するより高い精度が出る。
ゼロから訓練
大量データ・長期間・高コスト。データが少ないと過学習しやすい。
転移学習
少量データ・短期間・低コスト。既存モデルの知識を活用できる。
⚠️ ひっかけ注意ポイント
「転移学習=ファインチューニング」は不正確
ファインチューニングは転移学習の一手法。転移学習は概念で、ファインチューニングはその具体的な実施方法の1つ。
「少量データでも大丈夫」の理由を理解する
特徴抽出のための知識は既存モデルが持っている。新タスクで学習するのは出力部分だけなのでデータが少なくて済む。
機械学習・深層学習との違い
機械学習・深層学習はデータから学習する手法全般。転移学習はその中で「既存モデルを活用する」特定のアプローチ。
ドメインが大きく違うと効果が薄い
画像認識モデルを自然言語処理に転用するなど、タスクの性質が全く異なる場合は転移学習の効果が下がる。
🧠 覚え方(無理やりゴロ)
転移学習=「先輩の脳みそを借りて試験を受ける」
先輩(大規模モデル)の知識(特徴抽出層)をそのまま借りて、自分の科目(新タスク)だけ足す
ゴロ:「転校生(転移)は前の学校の知識を持ち込む」
転校生=転移学習 / 前の学校で得た知識(学習済みモデル)を新しい学校(新タスク)で活かす