【AI:Part 1】DeepSeekとは?米国株式市場急落を引き起こしたDeepSeekショックの真相に迫る!

- 本編は、AI業界で注目を集めているDeepSeek R1の概要やその特徴、技術的な革新性、オープンソース戦略、コスト効率、さらに米国企業への影響に関する長編レポートであり、3つの章で構成されています。
- 本稿Part 1では、「DeepSeekとは?」、並びに、「DeepSeekショックとは?」という疑問に答えるべく、AI業界と米国株式市場を揺るがす存在となった中国企業の研究成果「DeepSeek R1」について、技術的な特徴やその革新性、競合他社との比較、AI分野への影響などに関して詳しく解説していきます。
- DeepSeek R1は、中国の研究企業が開発したオープンソースAIモデルで、OpenAIと同等の性能を3~5%のコストで実現し、AIコミュニティに衝撃を与えています。
- このモデルは無料で利用可能で、複数のモデルサイズを公開し、研究者や開発者が容易にアクセスできる環境を提供しています。
- コスト効率や地政学的影響、強化学習を活用した技術的革新が評価され、AI分野におけるオープンソースの可能性を示しています。
DeepSeekとは?
1月20日、そう、ちょうど米国大統領就任式の日に、これまでほとんど知られていなかった中国の研究企業がDeepSeek R1のリリースを発表しました。その技術論文の詳細はこちらです。DeepSeek R1には、ブラウザから直接アクセスできます。ぜひ自分で試してみることを強くお勧めします。
注:私の場合、登録プロセスが少し面倒でした。メールに送られてきた確認コードが何度も拒否されました。諦めかけていたところ、最後にもう一度確認したら、実際には登録が成功していたことがわかりました。「無効なコード」という警告が出ていたにもかかわらずです。
もし自分でDeepSeek R1を試す気がない場合は、この投稿の最後にいくつかのプロンプトとそれに対する返答を載せておきますので、参考にしてください。
たった1週間前のことですが、今やDeepSeek R1は広範なAIコミュニティを完全に席巻していると言っても過言ではないでしょう。なぜでしょうか?簡単に言えば、OpenAIが提供する最高の成果と同等の結果を提供すると主張しているからです。上記の論文の冒頭にあるこの一文がそれを示しています:
(原文)DeepSeek R1 achieves performance comparable to OpenAI-o1-1217 on reasoning tasks.
(日本語訳)DeepSeek R1は、推論タスクにおいてOpenAI-o1-1217と同等の性能を達成します。
それだけではありません。DeepSeek R1はオープンソースで、無料でダウンロードしてPC上でローカルに実行できます。もちろん、特定のモデルとパラメータ数に応じて十分なストレージが必要ですが。
(原文)To support the research community, we open-source DeepSeek-R1-Zero, DeepSeek-R1, and six dense models (1.5B, 7B, 8B, 14B, 32B, 70B) distilled from DeepSeek-R1 based on Qwen and Llama.
(日本語訳)研究コミュニティを支援するため、DeepSeek-R1-Zero、DeepSeek-R1、およびQwenとLlamaに基づいてDeepSeek-R1から蒸留された6つの密なモデル(1.5B、7B、8B、14B、32B、70B)をオープンソースとして公開します。
しかし、それだけではありません。VentureBeatによると、APIをOpenAIが請求するコストのほんの一部で利用できるとのことです。
(原文)DeepSeek R1’s Monday release has sent shockwaves through the AI community, disrupting assumptions about what’s required to achieve cutting-edge AI performance. Matching OpenAI’s o1 at just 3%-5% of the cost, this open-source model has not only captivated developers but also challenges enterprises to rethink their AI strategies.
(日本語訳)DeepSeek R1の月曜日のリリースは、AIコミュニティに衝撃を与え、最先端のAI性能を達成するために必要なものについての前提を覆しました。OpenAIのo1と同等の性能をわずか3%~5%のコストで実現したこのオープンソースモデルは、開発者を魅了するだけでなく、企業にAI戦略の再考を迫っています。
さらに、VentureBeatによると、彼らは約50,000台のGPUを使用してモデルを訓練したとされています。これはOpenAIなどが使用した量の約10分の1です。
(原文)To train its models, High-Flyer Quant secured over 10,000 Nvidia GPUs before U.S. export restrictions, and reportedly expanded to 50,000 GPUs through alternative supply routes, despite trade barriers. This pales compared to leading AI labs like OpenAI, Google, and Anthropic, which operate with more than 500,000 GPUs each.
(日本語訳)モデルを訓練するために、High-Flyer Quantは米国の輸出規制前に10,000台以上のNvidia GPUを確保し、その後、貿易障壁にもかかわらず代替供給ルートを通じて50,000台に拡大しました。これは、OpenAI、Google、Anthropicなどの主要なAI研究所がそれぞれ50万台以上のGPUを運用しているのとは対照的です。
そして、月曜日の米国株式市場での真実の瞬間が訪れました。エヌビディア(NVDA)とブロードコム(AVGO)が主導する広範な売りが発生し、両社とも約17%下落して終了しました。彼らのファウンドリーパートナーであるTSMC(TSM)も13.3%下落しました。
ここには多くのことが含まれています。これらの主張は信頼できるのでしょうか?もしそうなら、OpenAIやその他の米国企業にとってどのような意味があるのでしょうか?おそらくもっと重要なのは、エヌビディアとその最先端GPUに対する需要予測にとって何を意味するのでしょうか?昨夜の大規模な売りは過剰反応だったのでしょうか、それとも加速コンピューティングに対する全く新しい需要プロファイルの現実的な反映だったのでしょうか?
本稿では、これらのポイントを深く掘り下げていきます!では、早速詳細に入っていきましょう!
また、私は半導体&テクノロジー銘柄に関するレポートを毎週複数執筆しており、私のプロフィール上にてフォローをしていただくと、最新のレポートがリリースされる度にリアルタイムでメール経由でお知らせを受け取ることができます。
加えて、その他のアナリストも詳細な分析レポートを日々執筆しており、インベストリンゴのプラットフォーム上では「毎月約100件、年間で1000件以上」のレポートを提供しております。
そのため、私の半導体&テクノロジー銘柄に関する最新レポートを見逃さないために、是非、フォローしていただければと思います!
DeepSeekの信頼性
ここでは、意図的に高レベルの定性的評価に留まり、DeepSeek R1を訓練するために必要な計算能力について現在巻き起こっている議論に深入りしないようにします。これは、私にはわからないことが現実であり、あなたの推測も私の推測と同じくらいの価値しかないからです。また、昨夜の売りによってすでに「ダメージ」が計測されているため、それほど重要ではないと見ています。
しかし、AI分野の信頼できるプレイヤーが何を考え、何を言っているかを見ることは重要だと思っております。まずはMarc Andreessen氏(アメリカの有名な起業家・投資家)から見ていきましょう:
(日本語訳)Deepseek R1は、これまで見た中で最も驚異的で印象的な革新の一つです。そして、オープンソースとして世界への素晴らしい贈り物でもあります。
(出所:@pmarca)
エヌビディアのシニアリサーチマネージャーであるDr. Jim Fan氏:
(日本語訳)私たちは、非米国企業がOpenAIの本来のミッションである「すべての人に力を与える、オープンで最先端の研究」を守り続けている時代に生きています。正直、理屈では説明がつきません。最も面白い結果が、最も現実的ということでしょう。
(日本語訳)DeepSeek-R1は、膨大なモデルをオープンソース化するだけでなく、トレーニングの秘密までも公開しています。さらに、RL(強化学習)のフライホイールが大規模かつ持続的に成長することを示した、初めてのOSSプロジェクトと言えるかもしれません。
Dr. JimのコメントはDeepSeekによって取り上げられ、彼らのウェブサイトのこのブログ投稿で見つけることができます。
(日本語訳)エヌビディアのシニアリサーチマネージャーであるジム・ファン氏がDeepSeek R1を称賛:「オープンソースAIの理念を真に体現」
(出所:DeepSeekのHP)
この時点で、私はDeepSeek R1自体を使って、AI分野で最も影響力のあるプレイヤーからの最も肯定的なコメントを要約するのに役立てることにしました。以下はその結果です(Marc Andreessen氏が最初に選ばれたのも興味深いです!)。
1. Marc Andreessen氏(Andreessen Horowitzの共同創業者)
DeepSeek R1を「私が今まで見た中で最も驚くべき印象的なブレークスルー」と称賛し、そのオープンソースの性質と高度な推論能力から「世界への深い贈り物」と呼びました。
2. Yann LeCun氏(メタ・プラットフォームズのチーフAIサイエンティスト)
DeepSeekの成功は、プロプライエタリモデルに対するオープンソースモデルの優位性を強調していると主張しました。彼は、DeepSeekがPyTorchやLlamaのようなオープンツールを基に構築されたことを強調し、協力的なイノベーションが進歩を促進することを証明したと述べました。
3. Jim Fan氏(エヌビディアのシニアサイエンティスト)
DeepSeekの透明性を強調し、「主要な持続的な強化学習(RL)フライホイールの成長を示した最初のオープンソースプロジェクト」と呼びました。彼は、その詳細な技術開示と訓練方法論を称賛しました。
4. Aravind Srinivas氏(PerplexityのCEO)
DeepSeekが「OpenAIのo1-miniをほぼ再現し、オープンソース化した」と指摘し、その競争力と開発者にとってのアクセシビリティを強調しました。
5. Dimitris Papailiopoulos氏(Microsoft AIリサーチャー)
DeepSeekの「エンジニアリングのシンプルさ」についてコメントし、徹底的なステップバイステップの推論よりも正確な回答に焦点を当てることで、計算需要を減らしながら効果を維持していることを賞賛しました。
6. Clement Delangue氏(Hugging FaceのCEO)
DeepSeekのような中国のオープンモデルが特定のベンチマークで「王者」であり、グローバルなオープンソースイノベーションを推進していると認めました。
7. Liu Qingfeng氏(iFlytekの創業者)
DeepSeekのような中国のモデルが米国のモデルとの差を縮め、STEM(Science、Technology、Engineering、Mathematicsの頭文字を取った言葉)やコーディングなどの垂直アプリケーションで優れていると断言しました。
8. Kai-Fu Lee氏(AI投資家、元Google中国ヘッド)
DeepSeekのリソース効率を称賛し、米国のチップ制裁と限られたコンピューティングインフラにもかかわらず高い性能を達成する能力を指摘しました。
9. Garry Tan氏(Y CombinatorのCEO)
DeepSeekのコスト効率の高い訓練(5.58M vs.競合の100M+)がAIの採用を加速し、参入障壁を下げることで業界全体に利益をもたらすと主張しました。
10. Hancheng Cao氏(Emory大学教授)
DeepSeek R1を、リソースが限られた地域の研究者にとっての「平等化ブレークスルー」と表現し、最先端のAIツールへのアクセスを民主化すると述べました。
上記のコメントにおける主なテーマ
・オープンソースの利点
複数のリーダー(LeCun、Andreessen)が、DeepSeekの成功がオープンソースの協力を検証していると強調しました。
・コスト効率
モデルの低い訓練コスト(5.58M)と手頃なAPI価格(100万出力トークンあたり16ドル)が広く称賛されました。
・地政学的影響
米国の制裁が中国のイノベーションを刺激し、DeepSeekが制約下で最適化したと指摘されました。
・技術的イノベーション
強化学習(RL:Reinforcement learning)中心の訓練と蒸留技術が画期的であると強調されました。
以上が、DeepSeek R1が米国の競合他社が提供する最高のものに匹敵する信頼できる挑戦者であるという圧倒的なコンセンサスを示しています。
次章では、DeepSeek R1が競合他社に対して迅速に成功を収めた要因や、同モデルがAI業界にもたらす影響について詳しく解説していきます。
また、私は半導体&テクノロジー銘柄に関するレポートを毎週複数執筆しており、私のプロフィール上にてフォローをしていただくと、最新のレポートがリリースされる度にリアルタイムでメール経由でお知らせを受け取ることができます。
加えて、その他のアナリストも詳細な分析レポートを日々執筆しており、インベストリンゴのプラットフォーム上では「毎月約100件、年間で1000件以上」のレポートを提供しております。
そのため、私の半導体&テクノロジー銘柄に関する最新レポートを見逃さないために、是非、フォローしていただければと思います!
※続きは「【AI:Part 2】DeepSeekの株価への影響とは?OpenAIやエヌビディア等の既存AI関連銘柄への影響に迫る!」をご覧ください。
アナリスト紹介:ウィリアム・キーティング
📍半導体&テクノロジー担当
キーティング氏のその他の半導体&テクノロジー銘柄のレポートに関心がございましたら、こちらのリンクより、キーティング氏のプロフィールページにてご覧いただければと思います。
インベストリンゴでは、弊社のアナリストが「高配当銘柄」から「AIや半導体関連のテクノロジー銘柄」まで、米国株個別企業に関する分析を日々日本語でアップデートしております。さらに、インベストリンゴのレポート上でカバーされている米国、及び、外国企業数は「250銘柄以上」(対象銘柄リストはこちら)となっております。米国株式市場に関心のある方は、是非、弊社プラットフォームより詳細な分析レポートをご覧いただければと思います。