COLUMN
AI連載(5):画像AIによる行動認識の最前線 - OKIが挑む製造現場の高度化

この記事で分かること
- 画像AIによる行動認識が製造現場で求められる理由と、その価値
- ポカヨケ・行動分析・技能伝承など、行動認識技術の具体的な活用シーン
- 骨格抽出と時系列AIモデルを組み合わせた行動識別の仕組み
- 識別精度を高める「階層的識別技術」の考え方と検証による有効性
本連載ではこれまで、「AIを安心して実装するための基盤づくり」から「業務・事業・イノベーションへの展開」に至る段階的なストーリーとして、(1)世界初のAI規制・EU AI法が企業に与える影響、(2)OKIが長年取り組んできたAIガバナンスの枠組みと実践、(3)安全な生成AI活用基盤「OAICS」を軸とした社内業務の高度化、そして(4)生成AIを活用したアイデア創出支援エージェント「ダ・ビンチ グラフ®」によるイノベーション創出の取り組みをご紹介してきました。
AI連載(5)の今回は、製造現場という“現場の最前線”にAIがどのように貢献できるのか、とりわけ、AIが人の細かな動きを理解し、工程を構造的に把握する「行動認識技術」について、具体的な応用例と、OKIの研究開発成果を交えて詳しくご紹介します。
なぜ今、製造現場に行動認識が必要なのか
製造現場では、熟練者の減少、人手不足、工程の複雑化、品質要求の高度化など、多くの課題が同時並行で進行しています。
従来、作業品質の確保や工程管理の多くは、熟練者の経験や目視確認に依存していました。しかし人手不足や技術者の高齢化など人的リソースの制約が強まる中、「作業を客観的に把握し、標準化・自動化の基盤にする」ためのデータ取得手段として、画像AIによる行動認識が注目されています。
行動認識とは、カメラ映像から作業者の動作や手順を理解し、「何を、どの順番で、どれくらいの時間で行ったか」を定量的に捉える技術です。
これは品質管理・工程改善に直結するだけでなく、事故防止や教育効率化にも大きな価値をもたらします。AI連載(1)~(4)で扱ってきた「安全なAI活用基盤」「社内実装」「イノベーション創出」の延長線上にある、“現場実装型AI” の事例です。

画像AIを用いた行動認識技術
OKIでは、人手作業が欠かせない製造現場において、より高度な品質確保や工程管理などの実現を目指し、画像AIを用いた作業者の行動認識技術を開発しています。この技術は、対象人物の骨格などの用途に応じた有効な情報を動画像から抽出し、時系列AIモデルの処理により一連の細かな行動の認識ができます。そのため、たとえば、製造ラインにおける作業ミスの判定や作業時間の分析などのアプリケーションに非常に有用です。
画像AIによる行動認識は、以下の2つの技術要素を組み合わせることで実現します。
- 動画像から骨格や体のパーツ、部品などの位置や動きを抽出する「特徴抽出」
- 抽出された位置や動きの情報を時間方向に並べ、一連の行動として理解する「時系列AIモデル」
特に製造現場では、「工程は一連の流れ」であり、単一フレーム(静止画)だけでは判断できません。「部品を取る→位置に合わせる→取り付ける→確認する」という流れを、正しい順番で行っているかどうかが重要です。時系列AIモデルは、この「流れ」を学習し、工程全体の理解に寄与します。

製造現場での活用アプリケーション例
行動認識技術は、製造ラインにおけるさまざまな用途に応用できます。以下はOKIが想定する代表的なアプリケーション例です。
製造現場での活用アプリケーション例
ポカヨケ(ヒューマンエラー防止)
工程に必要な一連動作の順番や各動作の継続時間をAIが自動で認識し、手順間違いや部品取り違い、作業漏れなどのエラー兆候をリアルタイムで検知します。作業者へ即座にフィードバックすることで、品質事故の未然防止が可能になります。
行動分析による工程改善
AIが蓄積した行動ログを数値化・統計分析することで、作業のムダや動作の偏り、トラブル発生時の要因を客観的に把握できます。これにより、ライン改善のスピードと精度が大幅に向上します。また、行動認識アプリケーションを現場で運用することで、膨大な作業映像が副次的に蓄積されます。これらは通常であれば取得が難しい“現場知”のデータであり、技能継承や教育にも活用できます。
技能伝承・教育
映像と行動ログを組み合わせることで、未経験者が熟練者の動作を正しく模倣できる教材を生成できます。作業工程の違いを客観的に比較できるため、教育効率の向上にも寄与します。
行動認識を実現する技術要素
行動認識では、用途に応じて動画像から「骨格情報」など有効な特徴を抽出し、時系列AIモデルを活用して一連の行動を識別します。さらに、識別結果から「作業手順の正しさ」や「時間配分」などを分析し、アプリケーションとして実装できます。OKIの本庄工場では、PHS組み立て工程にこのアプリケーションを適用した事例があります。(関連資料①②)

精度向上の鍵:階層的識別技術
製造現場の行動認識は、「細かな行動の違いを識別する」という難しさがあります。たとえば、「部品を取る」「部品を置く」「ネジを締める」「位置1でネジを締める」「位置2でネジを締める」など、行動の粒度が大きく異なり、境界も曖昧です。従来の“フラットな識別”では、すべての行動を同じレベルで学習させるため、細かな違いの誤識別が起きやすく、精度向上が難しいという課題がありました。
OKIはこの課題に対し、「階層的識別」というアプローチで技術的突破口を開きました。
精度向上を実現する「階層的識別」とは
階層的識別とは、対象行動を「大まかな分類 → 中分類 → 細分類」と階層に分け、段階的に識別する手法です。複雑な識別タスクを複数のより簡単なタスクに分割することで、AIモデルの学習負荷を下げ、難しい行動の識別精度を向上させることができます。
「スタンバイ⇒ワーク設置⇒複数の位置に部品を取り付け⇒ワーク移動」の作業工程の例
/「フラットな識別」と「階層的な識別」
有効性の検証
OKIでは、デスクトップPCを組み立てる工程(※研究用のデータセット)に対して検証を行いました。この工程は、ファン、RAM、SSDなどの複数の部品を本体に取り付ける作業です。識別対象は全20行動があり、「ファンを取る」、「ファンを取り付ける」、「ネジを位置1に締める」などと粒度がさまざまです。
デスクトップPCの組み立て工程
検証の結果、階層的識別の適用により「部品を取る」「部品を取り付ける」「ネジを位置1に締める」「ネジを位置2に締める」など、細かな行動の誤識別が大幅に軽減することを確認しました。これは、部品の取り忘れやネジ締め忘れなどの判定アプリケーションの実現につながる成果です。
(上)部品を取る行動に対する識別結果/(下)位置別のネジ締めに対する識別結果
緑の字:正解/赤字:推論 階層的な識別では3段階で表示
(Coarse_Level:大まかな識別|Mid_Level:中レベルの識別|Fine_Level:詳細な識別)
本研究成果は、国際会議 International Conference on Quality Control by Artificial Vision 2025 でも発表しています。(関連資料③)

まとめ
画像AIによる行動認識は、一連の詳細な行動を認識することで、作業の良否判定や時間計測などのアプリケーションに適用することができ、製造現場の品質確保、工程管理、技能伝承など、幅広い現場課題を解決する有力な手段です。
OKIは、骨格抽出・時系列AIモデル・階層的識別などの基盤技術を組み合わせ、人手作業が欠かせない製造現場において、より高度な品質確保や工程管理などの実現に向けた作業者の行動認識技術の開発を推進しています。
今後も製造分野に限らず、セキュリティやヘルスケアなど多様な分野への応用を見据えつつ、技術課題の抽出と改善に向けた研究を継続していきます。
製造などさまざまな現場での画像AI活用に関するご相談は、こちらよりお気軽にお問い合わせください。
今回の内容をグラフィックレコーディング動画でおさらいできます!
本連載コラムは次回以降も、社会を支えるためのさらなる具体的なAI技術とソリューションをご紹介します。ご期待ください。
- 参考情報/関連リンク
-
●関連資料①
OKIテクニカルレビュー 238号 作業内容や作業手順の正しさを判定する行為判定システム
工場のDX化を実現するManufacturing DX ~OKI本庄工場事例:行為判定システム~ - プレゼンテーション|OKI Style Square|OKI●関連資料②
製造現場向け作業者の詳細な行動認識技術(2022年 No.239)|技術広報誌 OKIテクニカルレビュー|OKI●関連資料③
Hierarchical fine-grained action recognition for manufacturing applications
QCAV2025 | The 17th International Conference on Quality Control by Artificial Vision.- ●デスクトップPCを組み立てるデータセット
Desktop Assembly Dataset
PICK UP
その他の記事
TAG
キーワードから探す
RELATED ARTICLES
関連記事
CONTACT
OKI Style Squareに関するご相談・
お問い合わせはこちら




