コラム
2024.12.09
LLM(大規模言語モデル)開発に強い企業一覧や選び方を解説
- LLM(大規模言語モデル)の基本概念と主な活用シーン
- LLM開発の進め方と、おおよその開発コスト感
- LLM開発に必要なスキルセットと人材要件
- 信頼できるLLM開発企業を選ぶ際のチェックポイント
- LLMに強みを持つ国産開発企業と、それぞれの特徴
01 LLM(大規模言語モデル)とは
LLMとは、大量の言語パターンを学習させることで、人による可読性が高く違和感のないテキストを出力できる大規模な言語モデルです。
(LLMはLarge Language Modelsの略語です。)
LLMは以下のような活用事例があります。
- チャットボットで顧客の質問に自動応答する
- 顧客の意見や市場の動向などを分析しマーケティング活動に活用する
- 文章の要約や翻訳、記事の作成を行う
ほかにもプログラミング開発のレビューや情報抽出など、さまざまな分野で応用されているのが特徴です。
LLM(大規模言語モデル)の開発方法
LLM開発の主な方法は以下の通りです。
- LLMで何を実現したいのか、どのような機能が必要かなどの要件を定める
- データを収集し不要な情報の削除や単語への分解、フォーマット統一などを行う
- 収集したデータをもとに言語モデルの学習を進めたり、必要に応じて改善したりする
開発するシステムの性能や範囲によって開発金額は異なり、数百万円〜数千万円、規模が大きい場合は数億円単位の事業となります。
02 LLM(大規模言語モデル)開発に必要なスキル
LLM開発には、機械学習の経験や統計に関する知識などが必要です。
以下で、LLM開発に欠かせないスキルを解説するので参考にしてください。
機械学習の知識や経験
LLMの実装には機械学習の知識やスキルが必要です。LLMに大量のデータをスピーディに学習させるために、プログラミングはもちろんクラウド環境などのスキルも求められます。
統計に関する知識
LLM開発には、統計学に関する知識も役立ちます。LLMによるデータ分析の際、統計学に基づきパターンを抽出し、最適なモデルを構築します。
出力データの正確性を追求するためにも、統計の知識は必要です。
論理的思考力
データ学習の際は論理的に道筋を立てて課題を設定し、LLMを調整することが欠かせません。
LLMから出力されたデータは正確性に欠けるケースがあります。出力データを多角的に検証し、正確性を向上させるためにも論理的思考力が必要です。
03 信頼できるLLM開発企業を選ぶ方法
安心して依頼できるLLM開発企業の特徴は、以下を参考にしてください。
- 自社の目的に最適な開発提案を受けられる
- サポート体制が充実している
- セキュリティ対策が十分行われている
- 導入コストだけでなくランニングコストやオプション費用などコスト説明に透明性がある
特に、セキュリティ面は情報流出のリスク回避のために欠かせない項目です。
04 LLM(大規模言語モデル)に強い国産開発企業一覧
LLM開発には、国産開発企業のモデルを利用したり、サポートを得たりするのがおすすめです。
以下で、LLMに強みを持つ国内企業を紹介するので参考にしてください。
WEBEDGE
WEBEDGEはLLMの要件定義から開発まで、一貫したサポートを展開しています。「伴走DX」は、事業戦略から開発部門の構築まで予算に合わせてDX化を促進し、売上創出のサポートを行います。
|
サービス特徴 |
・売上創出の「攻め」、業務改善の「守り」それぞれに重点を置いたDX化のサポートが可能 ・DXパートナーとして、300社以上の公官庁や大手および中堅企業の課題を解決した実績がある |
|
サービス紹介ページ |
NTT
NTTは大規模言語モデルの電力やGPUクラスタの大量消費による経済的負担の大きさに着目し、軽量かつ高性能な日本語処理性能を持つ「tsuzumi」を開発しました。
|
サービス特徴 |
・日本語学習データの量と質の向上により軽量化に成功 ・経済的な課題を解決できるほか、ローカル環境での利用が可能 |
|
サービス紹介ページ |
株式会社サイバーエージェント
株式会社サイバーエージェントは以前からLLM開発に取り組んでおり、独自の日本語LLM「CyberAgentLM」を開発後もバージョンアップを続けています。
|
サービス特徴 |
・オープン開発によるLLMではトップクラスの日本語能力を誇る ・本モデルを調整し、商用利用可能な対話型AIの開発などが可能 |
|
サービス紹介ページ |
東京大学松尾研究室
東京大学松尾研究室は、日本語のほか英語のデータセットを用いて事前学習・事後学習を行い、100億パラメータサイズのLLM「Weblab-10B」を開発しました。
|
サービス特徴 |
・事後学習後のモデルは、公開済みの日本語大規模言語モデルの中で最高水準を誇る ・日本語だけでなく大量の英語データも学習済み |
|
サービス紹介ページ |
ストックマーク株式会社
ストックマーク株式会社はビジネス用途での高い信頼性が期待できる「Stockmark-13b」を開発しました。
|
サービス特徴 |
・ビジネスに関する特許などを学習しており、誤回答を抑制し回答の精度が高い ・商用利用可能で出力スピードや計算コストなどの課題に対応している |
|
サービス紹介ページ |
富士通
富士通はスーパーコンピュータ「富岳」で学習し、高性能な日本語処理能力を誇る「Fugaku-LLM」を開発しました。
|
サービス特徴 |
・国内で開発されているパラメータより高性能かつ扱いやすいパラメータモデル ・サイバーエージェントが収集した日本語および英語学習の独自データの提供を受け、透明性と安全性を確保している |
|
サービス紹介ページ |
05 まとめ
Question
よくあるご質問
Q
LLM開発企業はどのような基準で選ぶとよいですか?
A
LLM開発企業を選ぶ際は、技術力だけでなく、自社の目的や活用シーンを理解した提案ができるかどうかが重要です。開発実績やサポート体制、セキュリティ対策の考え方まで確認することで、導入後のミスマッチを防ぎやすくなります。
Q
LLMは自社で開発するべきか、外部企業に依頼するべきか迷っています。
A
目的や社内リソースによって最適な選択は異なります。十分な人材や開発環境が整っていない場合は、外部企業の支援を受けながら進めるほうが、スピードや品質の面でメリットを感じやすいでしょう。段階的に内製化を目指す進め方も有効です。
Q
LLM開発にはどの程度のコストがかかるのでしょうか?
A
開発規模や要件によって幅がありますが、簡易的な活用であれば数百万円規模から検討できます。一方で、独自モデルの構築や高度なチューニングを行う場合は、数千万円以上の投資が必要になるケースもあります。初期段階で目的を明確にすることで、過剰なコストを抑えやすくなります。
Q
国産のLLM開発企業を選ぶメリットはありますか?
A
国産企業は日本語処理への対応力や、国内の法規制・セキュリティ要件への理解が深い点が強みです。ビジネス用途での安心感を重視する場合や、長期的なパートナー関係を築きたい場合に適しています。
Q
LLM導入後の運用や改善も支援してもらえますか?
A
開発だけでなく、導入後の運用や改善まで支援している企業も多くあります。実運用を通じて得られるデータをもとに調整を重ねることで、LLMの精度や実用性は高まります。WEBEDGEでは、開発後も伴走しながら継続的な改善をサポートしています。
-
執筆:WEBEDGE DX編集部
WEBEDGEは、DX推進・システム開発・AI活用支援の領域で企業のデジタル課題を解決するシステムインテグレーターです。
現場やお客様との対話で得られた知見をもとに、DX・AI・デジタル・ビジネス等に役立つ情報を発信しています。 -
監修:友田 俊輔
WEBEDGE代表・DX内製化/事業プロセス設計の実務家
DXを構造ごと任せて内製化する【DX内製化支援サービス】
詳細を見る
