【GENIAC第2期】大規模生成AI開発プロジェクトで「競争力のある成果」を生み出した開発の裏側
- NABLAS
- 8月8日
- 読了時間: 5分

国内の生成AIの開発力強化を目的とし、経済産業省及びNEDOが協力して実施するGENIAC。NABLASでは2024年10月~2025年4月までのGENIAC第2期での取り組みとして大規模視覚言語モデル(VLM)開発を行いました。今回はその開発の裏側を、NABLASのリサーチエンジニアである新立さんへお伺いしました!
※なお、当社は2025年7月に交付された第3期でも採択をされています。
GENIACとは
GENIAC(Generative AI Accelerator Challenge)は、国内の生成AIの開発力強化を目的とし、経済産業省及びNEDOが協力して実施する事業です。主に生成AIのコア技術である基盤モデルの開発に対する計算資源の提供や、データやAIの利活用に向けた実証調査の支援等を行っています
詳細はこちら
第2期のGENIACで取り組んだプロジェクトの概要を教えてください
第2期のGENIACプロジェクトでは、2つのモデル開発に取り組みました。1つ目は汎用的な大規模視覚言語モデル(VLM)の開発です。VLMとは画像とテキストの両方を処理するマルチモーダルな生成AIモデルで、日本語・英語両方の性能で国内最高水準を目指しました。2つ目は、食品分野に特化したVLMの開発です。そちらの開発では、ベンチマーク自体が存在しなかったので、データセットの作成からベンチマーク構築まで一から開発したのですが、GPT-4oを超える性能を実現することも目標として取り組んでいました。
なぜ、大規模視覚言語モデルを開発しようと思ったのですか?
そうですね、今回のプロジェクトに取り組んだ大きな理由の一つは、自社サービスにおいて、食品に特化した日本語モデルを構築したいという強いニーズがあったことです。その基盤となる、汎用性の高いVLMの開発は今後不可欠だと考えていました。それに加えて、日本語対応の強力なVLMがまだほとんど存在していなかったという現状も、開発の動機になりました。特に、画像や動画、さらには複数画像を一度に入力として扱える高性能な日本語対応VLMは非常に限られていました。
開発後は学習コードを含めほとんど全てオープンソース化しています。これにより、研究者や開発者が自分のデータセットでファインチューニングを行ったり、モデルの可能性を自由に試すことができる環境を整えられたと思います。長期的な話かもしれませんが、これが、国内で強力な大規模モデルを作るサイクルを回す助けになれば良いと思っています。

GENIACプロジェクトとしての苦労や、VLM開発において大変だった点は何ですか?
GENIACプロジェクトでは、複数関係者との連携のもと、計算リソースの見積もりと全体スケジュールを丁寧に詰めていく必要があり、調整の難しさを感じました。特にマルチGPU・マルチノード学習では、チェックポイント作成やログ解析に想定以上の時間を要し、技術的な試行錯誤が頻発しました。
技術面では、高品質かつ大規模な日本語データセットが存在していなかったことが大きな課題でした。英語データを日本語に翻訳したものや、一部だけが日本語で構成されているデータセットが大半であり、自分たちで前処理やノイズ除去を行い、細かなバグ修正に多くの工数を割きました。このプロセスを通じて「どのようなデータセットを用意すれば、どのようなモデルが得られるか」を実感できたのは大きな学びです。
また、既存のオープンソースモデルをベースに追加のモジュールを追加する際、大規模モデル特有のエラー特定と修正に時間がかかり、初期開発はスケジュールとの戦いでした。複数ベンチマークのバランス調整も難しく、一つを最適化すると他が下がってしまうというジレンマにも直面しました。既存の文献や標準的な手法が不十分な中で、独自に解決策を模索・構築するのはプロジェクト全体を通してもとても苦労した点です。
限られた時間とリソースの中で、成果に繋がる開発を求められていたこともあり、プロジェクトを前に進めるうえでの責任感は常にありました。その分、計画段階から開発が完了するまで常に慎重さとスピードの両方を意識して取り組めたと思っています。
上記の課題や苦労をどのように乗り越えましたか?
「いきなり大きく動かさず、まずは小さく試す」という方針を徹底しました。小さな検証を積み重ねることでリスクを最小化しつつ、本番フェーズに向けて確実に精度と安定性を高めていくアプローチです。これは、データセットの前処理やモデルの実装、計算環境の構築など、すべての工程を行う際に意識していたポイントです。
また、トラブル発生時の対応についても、優先順位を整理し、チーム内で認識をすり合わせながら進めることで、限られた時間とリソースの中でも確実に成果へつなげることができました。
何より大きかったのは、「競争力のあるモデルを作る」というやる気と「最後までやりきる」という責任感がチーム全体の共通意識としてあったことです。技術だけでなく、プロジェクトを前進させる気持ちとチームワークが、困難を乗り越える大きな力になったと感じています。

プロジェクトを通してやりがいや楽しさを感じたのはどんな部分でしたか?
自分たちが開発したモデルが日本国内で競争力のあるものになったことが、大きなやりがいにつながりました。ただ単にモデルを作って終わりではなく、今後自分たちが手がけるサービスやプロダクトで実際に使われることを想定して取り組んでいたので、「現場で使われるモデルを作れた」という実感が非常に嬉しかったです。性能面でも、最新のフロンティアモデルには及ばなくても十分満足できるレベルのものが完成し、その成果にもやりがいをかなり感じました。
また、大規模モデル開発においては、データセット作成、事前学習、事後学習など、それぞれ役割を分担してチームで進めることが非常に重要です。そうした分業体制を意識してプロジェクトを進められたことで、チームメンバーと協力して働く楽しさも大きなモチベーションとなりました。
今後の展望や目標を教えてください。
今回のプロジェクトで開発したVLMモデルを、自分たちのサービスに活用し、競争力のあるサービスとして実用化することが当面の目標です。そして、このVLMモデルを使ったサービス開発をし、ただ市場に出すだけでなく、しっかりと他社と競争できるような魅力的なサービスをつくっていきたいと考えています。
新立さん、インタビューありがとうございました!