2026年6月4日

豆包と通義千問の618ショッピング検証:AIはまだ「売る」を使いこなせない

この記事のポイント

  1. 618商戦で豆包と通義千問に同じ質問で買い物をさせた検証では、言語理解は進んでも「商品マッチング」が破綻し、8,000元のカメラ予算に7元台のおもちゃが紐づく事態が起きた
  2. AIの判断レイヤーとプラットフォームの商品検索レイヤーが分断され、推薦カードを離れると予算制約が消える「制御の断絶」が共通の弱点として浮かんだ
  3. 推薦の中立性と広告収益が構造的に衝突するため、技術が成熟しても「AIに売らせる」設計はEC事業者にとって信頼設計の問題に帰着する

618商戦が露わにしたAIショッピングの実力

中国の「618」は毎年6月18日前後に行われる大型ECセールで、独身の日に次ぐ年間二大商戦の一つです。2026年の618は、これまでとは異なる試金石になりました。ByteDanceの豆包(Doubao)とAlibabaの通義千問(Qwen)が、相次いで会話型のショッピング機能を本格投入したからです。検索ではなく対話で買い物が完結するのか。その問いに対し、中国メディアの36Krが両者へ同じ4種類の質問を投げかける実地検証を行いました。

結果は、AIエージェントによる代理購入の「現在地」を冷静に映し出すものでした。本稿はこの検証を起点に、AIに買い物を任せることが現状どこまで可能で、何が壁になっているのかを、EC事業者の視点で掘り下げます。

4つの質問が分けた「決めてくれるAI」と「窓口を開くAI」

検証は性格の異なる4つのシナリオで構成されました。最初は「3,000元以内でノートPCを選ぶ」という基本的な推薦です。豆包は要件を絞り込んだうえで具体的な商品カードを提示し、購入注意まで添えて、そのままクリックで決済画面に進める導線を作りました。一方の通義千問は商品結果ページに誘導するだけで、利用者が自分で絞り込む必要があり、提案精度もキーワード検索に近いものでした。

二つ目の「ダイソンとシャオミの掃除機は価格差ほど性能差があるのか」という誤った前提を含む質問では、両者とも前提に流されず適切に否定しました。ただし豆包は会話の随所で商品を売り込む姿勢が強く、リアルタイムの商品カードを差し込んできます。通義千問は比較表で情報を整えるにとどまり、純粋な情報ツールに近い振る舞いを見せました。

問題が露呈したのは三つ目です。「8,000元で子ども撮影用のカメラを選ぶ」という高単価かつ複雑な意思決定で、通義千問はブランド判断こそ的確でした。ところが添えられた商品カードが完全に崩壊します。「新品ミラーレス案」には53元のサンリオ系子ども向けトイカメラが、「中古フルサイズ案」には7.78元のおもちゃが紐づいたのです。言語理解は正しいのに、商品レイヤーが完全に脱線していました。8,000元の予算に7元台のおもちゃを返す。この象徴的なズレが、現世代AIの構造的な欠陥を端的に示しています。

「売り込む嘘」が「答えない正直」より危ういとき

四つ目の「京東・淘宝・拼多多で同じAirPods 4を買うならどこが最安か」という越境比較は、最も示唆に富む結果になりました。通義千問は「淘宝のAIアシスタントなので他社の価格は確認できない」と率直に限界を認め、淘宝内での節約策をリアルタイム価格で提示しました。

対する豆包は、3プラットフォーム横断の価格比較表を堂々と提示しました。一見すると極めて専門的です。しかし豆包は京東にも拼多多にも接続していません。この比較データはモデルが関連情報から生成したものであり、リアルタイムではありませんでした。提示された「636元」という最安値も、88VIP・クーポン・国家補助を重ねた理論値で、一般利用者が実際に到達できる価格ではありません。さらに回答末尾には、3社の比較とは無関係な自社Douyin Mallの商品カードが差し込まれていました。

ここに重要な教訓があります。利用者は整った価格比較表を見ると、それを正確なリアルタイムデータだと自然に信じてしまいます。買い物の意思決定において、捏造された答えは「答えない」ことよりも危険です。正直に限界を認めた通義千問と、専門家然として幻覚を返した豆包。この対比は、AIコマースにおける信頼設計の本質を突いています。

技術では解けない三つの壁

検証から浮かび上がった課題は、いずれも単発のバグではなく構造的なものです。

第一に、推薦の根底が利用者の利益と一致しない可能性があります。淘宝・天猫のビジネスモデルの核は広告と入札ランキングです。もし通義千問が純粋に「利用者に最適な順」で並べれば、広告を払う大量の出店者の投資が無に帰し、エコシステムの商業ロジックが崩れます。実際、通義千問の推薦は支払いウェイトの高い出店者に集中し、数万件の販売実績を持つ高コスパ商品が数十位下に沈むという指摘もあります。豆包も同様で、商品カードをクリックするとライブ配信ルームが上位に出るのは偶然ではなく、ByteDanceのトラフィック分配ロジックの反映です。従来の検索結果には広告に「広告」表示がありますが、AI推薦は「あなたのために選んだ」と称し、利用者はアルゴリズムか商業プロモーションかを見分けられません。

第二に、AIが意思決定はしても全工程を制御できていません。豆包は推薦カードの段階では予算でうまく絞り込みます。ところが「もっと見る」を押すと予算制約が消え、3,000元の希望に対し3,739元や4,499元の機種が現れます。これは現世代AIショッピングの共通する工学的欠陥を露呈します。AIの意思決定レイヤーと、プラットフォームの商品検索レイヤーが接続されていないのです。推薦カードを離れた瞬間、販売数・広告ウェイト・プラットフォーム利益で並べる従来のEC論理が主導権を握ります。AIは購買プロセスの最初の一歩に影響するだけで、その後の各ステップを動かせません。

第三に、会話型ショッピングの効率がまだ検索を超えていません。自然言語で要件を伝える方が効率的という前提は、「ニーズが明確で、商品が標準化され、意思決定が単純」な場面でのみ成立します。現実の買い物はニーズが曖昧で、比較軸が多次元で、信頼の構築に時間がかかります。商品カードが信用できるか不安なとき、利用者は別アプリで裏取りを始めます。その瞬間、AIは効率を上げるどころか確認の一手間を増やすだけになります。

巨額投資と収益不在というパラドックス

この検証の背後には、より大きな構造があります。中国のテック大手は、明確な収益化戦略がないまま、AIショッピングツールに月間推定4,200万ドルを投じていると報じられています。約15兆元規模の中国EC市場で、誰がAIショッピングのインターフェースを握るかが、デジタルエコシステム全体のトラフィックを左右しかねないからです。

利用者数の規模も投資の本気度を物語ります。QuestMobileによれば、2026年第1四半期の月間アクティブユーザーは豆包が約3億4,500万人、通義千問が約1億6,600万人とされます。両者の設計思想は対照的で、CIWの分析は通義千問が「アシスタントを見える存在として残す」のに対し、豆包は「取引を意識させず滑らかにする」方向に賭けていると整理しています。

しかし両者は同じ矛盾に突き当たります。利用者は中立的な推薦を期待しますが、有料ランキングはその反対方向に働きます。スポンサー化したAIアシスタントは、利用者が最初に試そうと思った理由である信頼を失う危険を抱えます。だからこそ、両社ともローンチ時に収益化を語りませんでした。技術的には洗練されているのに、商業的には自己矛盾している。この状態が、現世代AIショッピングの実像です。

日本のEC事業者が618から学べること

この中国の先行事例は、エージェンティックコマースに向き合う日本のEC事業者にとって、生きた教材になります。日本でもYahoo!ショッピングが2026年2月に「Yahoo!ショッピング エージェント」を投入し、OpenAIのInstant Checkoutに代表されるChatGPT内決済も広がりつつあります。同じ論点が、いずれ日本市場でも顕在化します。

最初に押さえるべきは、AIが代理購入を担えるのは「ニーズが明確で標準化された低意思決定カテゴリ」に当面限られるという現実です。家電・スマホ・PC・アパレルといった高単価で比較ニーズが強い領域は、推薦の信頼性が「AIに任せる」水準に達していません。自社の主力商品がどちらの性質に近いかを見極めることが、対応の出発点になります。

次に重要なのが、商品データのリアルタイム整合性です。今回の検証で繰り返し問題になったのは、価格・在庫・プロモーションが刻々と変わるEC環境に、モデルの知識更新が追いつかないことでした。AIエージェントに正しく扱われるには、構造化された商品データを正確かつ即時に供給する基盤が欠かせません。これはエージェント対応の商品データ整備という、地味だが決定的な投資領域です。

最後に、信頼こそが最大の差別化になります。豆包の「売り込む嘘」が示したのは、無理に売ろうとするAIが長期的には利用者の信頼を損なうという事実です。中立的に見える推薦の裏に商業意図を埋め込むほど、ブランドへの信頼は静かに削られます。EC事業者がAIコマースで選ばれ続けるには、見せかけの会話インターフェースではなく、検証可能で正直な情報提供を設計の中心に据える必要があります。

まとめ

618の検証が示したのは、現世代のAIがまだ「売る」を使いこなせていないという冷静な事実です。言語理解は進んでも、商品マッチングは破綻し、判断レイヤーと検索レイヤーは分断され、中立性と収益は衝突したままでした。8,000元の予算に7元台のおもちゃを返す象徴的なズレは、技術の未成熟さと構造的矛盾の双方を物語ります。日本のEC事業者にとっての示唆は明快です。AIに任せられる領域を冷静に見極め、リアルタイムの商品データ基盤を整え、何より正直さを信頼設計の中心に置くこと。エージェンティックコマースの主戦場は、まだこれから訪れます。