ビジネス

【連載】石黒邦宏の「日米デジタル論考」:おなかをすかせた生成AIエンジンと、データライセンシングにかじを切るソーシャル企業

【連載】石黒邦宏の「日米デジタル論考」:おなかをすかせた生成AIエンジンと、データライセンシングにかじを切るソーシャル企業

技術系Q&Aサイトの失速

読者の皆さんは「Stack Overflow」というサイトをご存じだろうか?

Stack Overflowはエンジニア向けのQ&Aサイトで、このサイトにプログラミングに関する質問を投稿すると、他のユーザーから回答を得ることができる。2008年に米国の著名エンジニア、Joel Spolsky氏によって立ち上げられてから、英語圏最大の技術系Q&Aサイトとして広く使われてきた。2023年8月時点で登録ユーザー数が1300万人を超え、累計のQ&A数がなんと5900万件以上に達するなど、プログラミングに関する最大の知識ベースとなっている。

Google等の検索エンジンで英語のプログラミング関連のキーワードを検索すると、上位にStack Overflowの回答がヒットすることが多いため、直接Stack Overflowのサイトを利用したことがなくても、その回答を目にしたことのある方も多いのではないだろうか。

昨年7月末、そのStack Overflowのトラッフィクが、生成AIのサービス公開後から急落したのではないかという投稿記事が話題になった。

AIエンジニアのAyhan Fuat Çelik氏が投稿した「Stack Overflowの落日」「The Fall of Stack Overflow」(*1)という記事で、Stack Overflowのトラフィックが生成AIのサービス公開後に約35%減少したという報告があった(当初50%減少とされていたが、後に集計に使われていたGoogle Analyticsの仕様変更の影響によるものだったことが判明。現在は35%に修正されている)。

ベンチャーキャピタリストのDr. Andre Retterath氏も「LLMによる死亡者 - Stack OverflowはChatGPTの犠牲者」(Death by LLM: Stack Overflow is a ChatGPT casualty)(*2)というセンセーショナルなタイトルの記事でこの件について取り上げた。ちなみにこちらの投稿はデータが古いのであまりお勧めはしない。

いずれにせよ、Stack Overflowのトラフィックが減少している、しかもかなりの割合でというニュースは大きなインパクトがあった。なぜならエンジニアの実感として、GoogleやStack Overflowで検索するより、ChatGPTを代表とする生成AIに質問する割合が格段に上がっていることをひしひしと感じていたからだ。特にStack Overflowの場合、新規の質問には回答が付かないこともあり得るし、回答が付くとしても数日後というのもざらにある。一方、生成AIの場合、当然だが質問に即答してくれるし、その回答内容も多くは的を射たものが返ってくる。どちらが便利かは言うまでもないだろう。

皆が生成AIに尋ねるようになると……

それと同時に、大きな疑問が湧き上がる。生成AIのほうが便利なので、Q&Aサイトで回答を求めるより、ChatGPTに聞くようになる。そこまではいいだろう。しかし新しい技術はどんどん生まれてくる。皆が生成AIサイトに聞くようになって、Q&Aサイトで返答が生み出されなくなった時に、生成AIはどうやってそうした新しい技術の回答を学べばいいのだろうか。

Gergely Orosz氏の「Stack Overflowの落日に関するレポートは大幅に誇張されているのか?」「Are reports of Stack Overflow’s fall greatly exaggerated?」(*3)はStack Overflowのトラフィック減少に関する優れた考察だが、末尾にその件について触れている。

The one thing left to answer is how will Stack Overflow incentivize people to ask

more answers? Looking at this broadly, when AI tools can answer most questions,

who will write the answers for complex questions which AI tools don’t have

answers for? And what will be their incentive to do so?

最後に残された問題は、Stack Overflowがいかにして人々に質問に対して回答を書くように促すかということです。AIツールがほとんどの質問に答えられるようになった時に、AIツールでは回答できない複雑な質問の答えを誰が書くのでしょうか? そして、彼らがそうする動機は何でしょうか?

Redditが株式公開を果たせた理由

さて、ここでちょっと話題が変わるが、皆さんは「Reddit」というサイトは知っているだろうか。いわゆる電子掲示板サービスで、説明が難しいのだが、治安のいい「2ちゃんねる」という言い方が一番しっくりくるかもしれない。

創業は2005年。現在19年目である。ソーシャルメディアの一つとして、数えきれないほどの競合と戦って、生き延びてきた古株のサービスだ。2006年、「Vogue」誌をはじめとするファッション誌を数多く傘下に持つコンデナストに買収された後、2011年に再度スピンアウト。2014年以降、何度も資金調達を繰り返し、なんとか株式公開できないかもがいてきた企業である。そこそこの売り上げはあるものの、まだ赤字で、数年前にも株式公開を計画したが、途中で断念した経緯がある。

そのRedditが2023年3月にやっと待望の株式公開を果たした。しかも初日に48%も値上がりという大成功を成し遂げたのである。

その成功の理由の一つが、生成AIへRedditのデータを提供するというビジネスであった。Redditの公開目論見書を見てみよう(*4)。

We are also in the early stages of monetizing our emerging opportunity in data

licensing by allowing third parties to access, search, and analyze data on our

platform. In January 2024, we entered into certain data licensing arrangements

with an aggregate contract value of $203.0 million and terms ranging from two to

three years. <snip> We believe our growing platform data will be a key element

in the training of leading large language models (“LLMs”) and serve as an

additional monetization channel for Reddit.

私たちは、提供先の企業がRedditプラットフォーム上のデータにアクセスし、検索、分析を許可することで、データライセンシングの新たな収益機会を活用する初期段階にあります。2024年1月、私たちは合計契約価値203.0百万ドル、契約期間2年から3年のデータライセンス契約を締結しました。<省略> 私たちは、成長を続けるRedditのプラットフォームデータが、主要な大規模言語モデル(LLM)のトレーニングにおいて重要な要素となり、Redditの追加的な収益源になると信じています。

昨年の売り上げが804百万ドルなので、203百万ドルはかなり大きな割合の収入になる。これ以外にもRedditは昨年グーグルに対して60百万ドルでRedditのコンテンツを検索できる権利をライセンスアウトしている。このまま行けばひょっとすると、メインの広告ビジネスの収益よりも、生成AIに対するデータ提供ビジネスのほうが大きくなるかもしれない。ソーシャルメディアのマネタイジングに、生成AIへの学習データ提供という選択肢が新たに生まれたのだ。

Stack Overflowユーザーのモチベーションはどこに?

そして2024年2月29日、Stack Overflowも「AIにおける社会的責任:われわれはどのようにパートナーを選ぶか」(*5)という分かりにくいブログポストで、今後のStack OverflowへのAPIアクセスについて、元記事への帰属の明示と、それにまつわるコストは補償されるべきだとアナウンスした。

グーグルの「Gemini」という生成AIはこのStack Overflowの新APIでデータを学習しているという (*6)。おそらくかなりの金額でライセンシングしているのではないかと推測される。

Stack Overflowで返答を書いていた人は、困っている人を助けたいという素朴な気持ちで書いていたに違いない。Redditでリンクをシェアしていた人は、単に自分の好きなコンテンツをシェアしたかったからに違いないだろう。そうした動機はこれまでと変わらなくても、生み出されたコンテンツがビジネスロジックとして、いや応なく生成AIによって学習されていくわけだ。

そうなった時に、世界知識の一部に貢献できていると喜ばしく思うのか? それとも映画「マトリックス」のように、知識を生み出す部品になってしまったと考えるのか? はたまた、まったく違った感想を持つのか?

いろいろと謎は尽きない。皆さんはどのようにお考えになるだろうか。

SNSシェア

この記事は面白かったですか?

今後の改善の参考にさせていただきます!

Ranking

ランキング

もっと見る