コラム

2024.09.09

LLM(大規模言語モデル)開発に強い企業一覧や選び方を解説

TOPInformationLLM(大規模言語モデル)開発に強い企業一覧や選び方を解説

 

「LLMはどの開発企業を選べば間違いないだろう」「自社開発する際に必要なスキルは何か」と悩む方も多いでしょう。

 

LLMは機械学習や統計などの知識・経験が求められるため、信頼できる企業のLLMモデルを利用したり、開発のサポートを依頼したりするのがおすすめです。

 

そこで本記事では、LLMの開発方法や必要なスキルのほか、信頼できるLLM開発企業の選び方を解説します。LLMに強い国産開発企業も紹介するので、ぜひ参考にしてください。

01 LLM(大規模言語モデル)とは

LLMとは、大量の言語パターンを学習させることで、人による可読性が高く違和感のないテキストを出力できる大規模な言語モデルです。
(LLMはLarge Language Modelsの略語です。)

LLMは以下のような活用事例があります。

  • チャットボットで顧客の質問に自動応答する
  • 顧客の意見や市場の動向などを分析しマーケティング活動に活用する
  • 文章の要約や翻訳、記事の作成を行う

ほかにもプログラミング開発のレビューや情報抽出など、さまざまな分野で応用されているのが特徴です。

 

LLM(大規模言語モデル)の開発方法

LLM開発の主な方法は以下の通りです。

  • LLMで何を実現したいのか、どのような機能が必要かなどの要件を定める
  • データを収集し不要な情報の削除や単語への分解、フォーマット統一などを行う
  • 収集したデータをもとに言語モデルの学習を進めたり、必要に応じて改善したりする

開発するシステムの性能や範囲によって開発金額は異なり、数百万円〜数千万円、規模が大きい場合は数億円単位の事業となります。

02 LLM(大規模言語モデル)開発に必要なスキル

LLM開発には、機械学習の経験や統計に関する知識などが必要です。

以下で、LLM開発に欠かせないスキルを解説するので参考にしてください。

 

機械学習の知識や経験

LLMの実装には機械学習の知識やスキルが必要です。LLMに大量のデータをスピーディに学習させるために、プログラミングはもちろんクラウド環境などのスキルも求められます。

 

統計に関する知識

LLM開発には、統計学に関する知識も役立ちます。LLMによるデータ分析の際、統計学に基づきパターンを抽出し、最適なモデルを構築します。
出力データの正確性を追求するためにも、統計の知識は必要です。

 

論理的思考力

データ学習の際は論理的に道筋を立てて課題を設定し、LLMを調整することが欠かせません。
LLMから出力されたデータは正確性に欠けるケースがあります。出力データを多角的に検証し、正確性を向上させるためにも論理的思考力が必要です。

03 信頼できるLLM開発企業を選ぶ方法

安心して依頼できるLLM開発企業の特徴は、以下を参考にしてください。

  • 自社の目的に最適な開発提案を受けられる
  • サポート体制が充実している
  • セキュリティ対策が十分行われている
  • 導入コストだけでなくランニングコストやオプション費用などコスト説明に透明性がある

特に、セキュリティ面は情報流出のリスク回避のために欠かせない項目です。

04 LLM(大規模言語モデル)に強い国産開発企業一覧

LLM開発には、国産開発企業のモデルを利用したり、サポートを得たりするのがおすすめです。

以下で、LLMに強みを持つ国内企業を紹介するので参考にしてください。

 

WEBEDGE

WEBEDGEはLLMの要件定義から開発まで、一貫したサポートを展開しています。「伴走DX」は、事業戦略から開発部門の構築まで予算に合わせてDX化を促進し、売上創出のサポートを行います。

サービス特徴

・売上創出の「攻め」、業務改善の「守り」それぞれに重点を置いたDX化のサポートが可能

・DXパートナーとして、300社以上の公官庁や大手および中堅企業の課題を解決した実績がある

サービス紹介ページ

https://bansou.webedge.jp/

 

NTT

NTTは大規模言語モデルの電力やGPUクラスタの大量消費による経済的負担の大きさに着目し、軽量かつ高性能な日本語処理性能を持つ「tsuzumi」を開発しました。

サービス特徴

・日本語学習データの量と質の向上により軽量化に成功

・経済的な課題を解決できるほか、ローカル環境での利用が可能

サービス紹介ページ

https://www.rd.ntt/research/LLM_tsuzumi.html

 

株式会社サイバーエージェント

株式会社サイバーエージェントは以前からLLM開発に取り組んでおり、独自の日本語LLM「CyberAgentLM」を開発後もバージョンアップを続けています。

サービス特徴

・オープン開発によるLLMではトップクラスの日本語能力を誇る

・本モデルを調整し、商用利用可能な対話型AIの開発などが可能

サービス紹介ページ

https://www.cyberagent.co.jp/news/detail/id=30463

 

東京大学松尾研究室

東京大学松尾研究室は、日本語のほか英語のデータセットを用いて事前学習・事後学習を行い、100億パラメータサイズのLLM「Weblab-10B」を開発しました。

サービス特徴

・事後学習後のモデルは、公開済みの日本語大規模言語モデルの中で最高水準を誇る

・日本語だけでなく大量の英語データも学習済み

サービス紹介ページ

https://www.t.u-tokyo.ac.jp/press/pr2023-08-18-001

 

ストックマーク株式会社

ストックマーク株式会社はビジネス用途での高い信頼性が期待できる「Stockmark-13b」を開発しました。

サービス特徴

・ビジネスに関する特許などを学習しており、誤回答を抑制し回答の精度が高い

・商用利用可能で出力スピードや計算コストなどの課題に対応している

サービス紹介ページ

https://stockmark.co.jp/news/20231027

 

富士通

富士通はスーパーコンピュータ「富岳」で学習し、高性能な日本語処理能力を誇る「Fugaku-LLM」を開発しました。

サービス特徴

・国内で開発されているパラメータより高性能かつ扱いやすいパラメータモデル

・サイバーエージェントが収集した日本語および英語学習の独自データの提供を受け、透明性と安全性を確保している

サービス紹介ページ

https://pr.fujitsu.com/jp/news/2024/05/10.html

05 まとめ

LLMは学習データの精査からデータの改善まで、さまざまな工程を経て開発します。機械学習や統計の知識、論理的な思考力を備えた人材の確保が必須であり、自社開発に踏み込めない場合もあるでしょう。

開発コストや人材育成にかかる費用や時間を減らすためには、LLM開発企業のサポートを受けるのも一つの手段です。

 

WEBEDGEが展開する「超伴走」「伴走型DX」は、LLMの要件定義から開発までトータル的なサポートが可能です。コンサルティングも行っているので、ぜひ気軽にご相談ください。

成果に直結する“超伴走型”デジタル人材サービス

詳細を見る

Contact

お問い合わせ