07/04/2024

Part 1:インターネットの進化:Web 1.0、Web 2.0、そしてレディットとAI・LLMと共に迎えるWeb 3.0の世界

black ipad with blue screenダグラス・ オローリンダグラス・ オローリン
  • インターネットの変化により、オープンAPIが消えつつあり、無料サービスが減少している中で、レディットやTwitterはデータの販売や利用にシフトしている。
  • 初期のインターネット(Web 1.0)は自由で実験的な場であったが、現在のWeb 2.0ではグーグルやフェイスブックが情報を集約し、広告収益を重視している。
  • レディットなどの大規模プラットフォームは、データ収集とAIトレーニングに注力し、新しいビジネスモデルを構築しており、全体として、インターネットは新規ユーザーの獲得よりも、既存データの収益化に向かっていると見ている。

はじめに

もし注意を払っていれば、インターネットが最近少し違ってきていることに気づくであろう。かつて私たちがインターネットとやり取りしていた多くの属性や方法が変わりつつある。それを最も強く感じたのは、私のお気に入りのウェブサイトの一つである subredditstats.com が先日この画像を見せてくれた時である。

レディット(RDDT)の無料 API は閉鎖される。しかし、X(旧Twitter)も同様に、インターネット上の他のプロパティも徐々に制限を設け、扉を閉じ始めている。ワールドワイドウェブはかつてのように完全に自由で開かれたものではなくなりつつある。オープン API とエコシステムは消滅しつつあり、これらのプラットフォームのゲートキーパーは壁を高くし、扉を閉ざしている。それはインターネットのビジネスモデルが変わり、データを収集するのではなく、データを販売する方向にシフトしているからだと思う。

また、他の場所では、インターネット全体が徐々に悪化しているのを感じることができる。グーグル(GOOG/GOOGL)の検索結果は有料関連のリンクの結果で詰まり、X は頻繁に故障する。まったく、私たちのウェブ体験は時間とともに良くなるどころか悪化しているように感じる。これは収益化の推進による部分もあるが、もう一つの要素は次のキラーアプリケーションである LLM のトレーニングによるインターネットのビジネスモデルの変化である。

より大きく、より良いモデルを作るための競争の中で、私たちは計算方法やそれに伴うインフラだけでなく、インターネットそのものも変えていると思う。私はこれがインターネットの次の重要なステップであり、Web 3.0 はインターネットの民主化ではなく、次の段階のための巨大なトレーニング場になると思う。私たちが知っているインターネットは次世代の AI モデルを生み出すために死にかけている。

しかし、未来に進む前に、過去を振り返ってみよう。それから、私たちが今日どこにいるのか、そして Web 3.0 がどのようになるのかについて話し合いたい。なぜなら、率直に言って、Web 2.0 よりもずっと無邪気ではないように見えるからである。

Web 1.0:若くて自由なインターネット

初めに Web 1.0 から話を始めたい。最初は、私たちの親が注意払っていたインターネット環境は自由で、実験的で、時間をかければ非常に役に立つものであった。無料またはほとんどコストがかからない価格で、豊富な情報、コミュニティ、またはその他の求めているものが至る所に存在していた(ウェブブログ、フォーラム、無料のインターネットブラウザ、無料の電子メール等)。新しく斬新なメディアや情報に対してお金を払うという概念は比較的新しかった。そして、「インターネット関連の仕事」というものは珍しかった。

初期のインターネットには多くの興奮があった。全世界がオンラインでつながり、可能性は無限に広がっているように見えた。人々は Geocities のようなプラットフォームで個人のウェブサイトを作り、世界中の視聴者と自分の考えや経験、情熱を共有していた。Hotmail や Yahoo! Mailのような電子メールサービスは、国境を越えて瞬時にコミュニケーションを取ることを可能にし、ICQ や AIM のようなインスタントメッセージングプラットフォームは、リアルタイムの会話やオンラインコミュニティを育んでいた。

初期のインターネットは、規則や規制がほとんどない西部開拓時代のようなものであった。それは実験のための遊び場であり、その規模は巨大であった。もちろん、この新しい土地へのゴールドラッシュがあり、この広大な新しい風景は大規模な投資を引き寄せた。それはもちろん、ブームとその後のバストを引き起こした。しかし、それはインターネットバブルの物語であり、今日は残念ながらその話をする時間はない。

しかし、インターネットが成長し成熟するにつれて、新しい可能性の時代への明確なシフトが起こった。そのシフトは一般的に Web 2.0 と呼ばれ、インターネットビジネスの実際の成長である。これはユーザー生成コンテンツが爆発的に増加し、ウェブ自体のインタラクティブ性が高まり、もちろんソーシャルメディアの登場があった時期である。

これが最終的に今日の大手技術企業におけるゲートキーパーを生み出した土地のラッシュであった。私は Web 2.0 を集約の時代と呼び、壁に囲まれた庭園の始まりとする。

Web 2.0:壁が立ち上がる

グーグル(GOOG/GOOGL)、フェイスブック(META)、YouTube、アマゾン(AMZN)はクラシックな Web 2.0 企業の例である。それぞれの会社は異なるビジネスモデルを持っていたが、特にソーシャルメディア企業は無料の製品で始まり、コンテンツの集約とユーザーに対する力を利用して注意を引き、その注意に対する広告を販売していた。これらのユーザーベースを集約することは強力であった。なぜなら、これらの会社にとっての限界コストはほとんどゼロだったからである。これは Web 2.0 の物語であり、Ben Thompson の実践的な Aggregation Theory フレームワークを通じて最もよく理解される。

この期間中、焦点はユーザーにあった。無料の製品で大規模なユーザーベースを作り、その後「無料の庭」の周りに徐々に壁を高くしていった。Web 2.0 の利点はもちろん、大規模な配信と膨大なデータ量であった。これらは次のパラダイムにおいてこれらの企業にとって大きな利点をもたらした。

この期間中の目標は、自分のコンテンツを他の庭と共有し、最終的にユーザーの目を自分の庭に向けさせることであった。だからこそ、一部のソーシャルメディア企業(TikTok)は、複数回にわたり他のプラットフォーム上で最大の広告主であったと主張できる。これらの市場シェアの変動は 2010 年代後半まで続いたと私は考えており、Web 2.0 時代の最も成熟した姿は 2010 年代後半に見られ、パンデミック前の最後の年である 2019 年は、Web 2.0 の最も安定した状態の例であった。

そして、次に訪れたのは COVID であり、それが需要の急増を引き起こし、インターネットサービスへの過剰な支出につながった。最終的には、その支出の反動で崩壊が起こった。

しかし、そのオフラインからオンラインへの大きな変化の中で、次のシフトを開始する静かな変化があった。それは、GPTに関してである。以前、私は GPT と計算能力の将来について執筆したが、それがインターネット全体にとって何を意味するのかについては考えたことがなかった。それが今日の話である。インターネットは成熟期に達しており、これらの成熟したビジネスは収益化する必要がある。現在、データの規模を収益化するための最も明白な方法は、AI トレーニングデータである。

成熟とビジネスモデル

インターネットと世界中のユーザーへの普及はもう初期段階にはない。ある推定によると、世界の 70% がインターネットを使用しており、このグラフはインターネットの普及が減速していることを示している。COVID は完全な普及への最後の大きな推進力であったかもしれず、現在は漸近線に達している。それにより、企業はもはやユーザーの獲得を急ぐのではなく、ビジネスモデルの確立を急ぐ必要に迫られている。

もはや新しいユーザーを獲得することで勝つことはできない。すべての新しい潜在的なユーザーはすでに参加している可能性が高い。今や戦っているのは毎年数千万人のユーザーを追加するゲームではなく、比較的固定されたゲームである。

最良の例はレディット(RDDT)であり、Similarweb によると、Reddit は世界のトップ 20 のウェブサイトの一つであり、アメリカでは第 10 位である。レディットはインターネット上で求められる規模を持っているが、最近の AI のデータライセンス契約まで膨大な金額を失っていた。もし、最も規模の大きいビジネスモデルの一つであるレディットが、より多くのユーザーから収益を上げられなかったとすれば、ユーザーを増やすこと自体がビジネスモデルの保証ではないとも言える。それは成熟と収益化の必要性を示唆しており、その収益化とはデータを収集してトレーニングに利用することである。

レディットはこれを認識しており、ビジネスモデル全体を LLM を訓練するための高品質データの販売にシフトしている。レディットの IPO 目論見書では、同社はデータの契約価値として 2億300万ドルを計上し、最近では、OpenAIにライセンス供与している

(原文)In January 2024, we entered into certain data licensing arrangements with an aggregate contract value of $203.0 million and terms ranging from two to three years. We expect a minimum of $66.4 million of revenue to be recognized during the year ending December 31, 2024 and the remaining thereafter. Reddit data constantly grows and regenerates as users come and interact with their communities and each other. We believe our growing platform data will be a key element in the training of leading large language models (“LLMs”) and serve as an additional monetization channel for Reddit.

(日本語訳)2024年1月、我々は総契約価値2億300万ドルの特定のデータライセンス契約を締結し、契約期間は2年から3年である。我々は、2024年12月31日を最終日とする一年間に最低6640万ドルの収益が認識され、残りはその後に認識されると予想している。レディットのデータは、ユーザーがコミュニティやお互いと対話するにつれて常に成長し再生される。我々は、成長し続けるプラットフォームデータが、主要な大規模言語モデル(LLM)の訓練において重要な要素となり、レディットにとって追加の収益化チャネルとなると信じている。

モデルが大きくなるにつれ、データセットの価値が高まるにつれて、これらのデータ契約の更新は新しいスポーツの権利のようになると想像している。毎年、契約価値は高くなるはずであり、AI経済におけるビジネスを行うコストの重要な部分としてデータの支払いが位置付けられるであろう。

レディットはこれを認識していると思う。彼らの IPO の目論見書は非常に AI 主導の文書であり、人々が相互作用するためのソーシャルメディア企業であれば異なる焦点を持つべきだと思われるが、AI が今後のビジネスモデルになることは確実である。インターネットに対する考え方を、ユーザーの集めから、広範なユーザーセットからデータを収集することにシフトする時である。

(原文)Finally, Reddit’s vast and unmatched archive of real, timely, and relevant human conversation on literally any topic is an invaluable dataset for a variety of purposes, including search, AI training, and research. Reddit is one of the internet’s largest corpuses of authentic and constantly updated human-generated experience. Reddit data constantly grows and regenerates as users converse. As the world becomes increasingly data-driven, we offer solutions that are human- and experience-focused. We expect our data advantage and intellectual property to continue to be a key element in the training of future LLMs.

(日本語訳)最後に、レディットの広大で無比なアーカイブである実際の、タイムリーで関連性のある人間の会話は、検索、AI トレーニング、および研究などのさまざまな目的にとって非常に価値のあるデータセットである。レディットはインターネット上で最も大規模な、本物で絶えず更新される人間生成の経験のコーパスの一つである。レディットのデータは、ユーザーが会話するにつれて常に成長し再生される。世界がますますデータ駆動型になるにつれ、我々は人間および経験に焦点を当てたソリューションを提供する。我々は、データの優位性と知的財産が今後の LLM の訓練において引き続き重要な要素となると期待している。

レディットは、Web 2.0 のビジネスモデルが Web 3.0 モデルに変わるほぼ完璧な例であると思う。この人間からデータをキャプチャしてモデルを訓練するという考え方で、これから何が来るのかを垣間見ることができると思う。Web 3.0 の世界へようこそ!

※続きは「Part 2:Web2.0の終焉、AI・LLM(大規模言語モデル)主導のWeb3.0がもたらすインターネットの未来、人間とAIの関係性」をご覧ください。

その他の半導体銘柄関連レポート

1. マーベル・テクノロジー / MRVL:AI・半導体銘柄の最新の2025年1Q決算速報・財務分析と今後の株価見通し&将来性

2. エヌビディア / NVDA / 予想配当利回り0.04%: 2025年1Q決算&株式分割を受けてNVIDIAの株価は急騰(前編)

3. アプライド・マテリアルズ / AMAT:まだ上値を狙えるか、2024年第2四半期決算速報・強み分析と今後の株価見通し・将来性

また、私のその他の半導体関連銘柄のレポートに関心がございましたら、是非、こちらのリンクより、私のプロフィールページにアクセスしていただければと思います。

さらに、その他のメタ・プラットフォームズ(METAに関するレポートに関心がございましたら、是非、こちらのリンクよりメタ・プラットフォームズのページにアクセスしていただければと思います。