ネット中立性に関する議論の最中、ボットがFCCのパブリックコメントシステムを破った経緯

ネット中立性に関する議論の最中、ボットがFCCのパブリックコメントシステムを破った経緯

5月下旬のある一日で、ネット中立性保護の撤廃計画に関する数十万件ものパブリックコメントが連邦通信委員会(FCC)に殺到した。1週間半後の6月3日には、さらに数十万件のコメントが続いた。急増したのは、FCCがインターネットサービスプロバイダー(ISP)によるコンテンツのブロックや制限をいつでも許可したらどうなるのかと懸念する、ネット中立性を支持するアメリカ人の声ではなかった。実際、彼らは真の声などではなかったのだ。

複数の研究者によると、FCCが受け取った過去最高の2,200万件のコメントのうち、100万件以上は、自然言語生成を用いてネット中立性保護の撤廃を求める声を人為的に増幅させたボットによるものだった。この数字は、実際のボット投稿のほんの一部に過ぎない可能性がある。ニューヨーク州司法長官事務所は現在、コメントの出所を調査している。

これまでの報道は、FCCに偽のコンテンツを大量に送りつける悪質な行為者に焦点を当てているが、電子フロンティア財団のような正当な団体が、同じ手法を用いて会員にボタンをクリックさせるだけで自動生成された(とはいえ真摯な)コメントをFCCに送信することを可能にしたことも事実である。その結果、生身の人間による活動の高まりが生まれた。その結果、ネット中立性に関するコメント募集期間では、これまでのすべての政府機関のコメント募集期間を合わせたよりも多くの意見が一般から寄せられた。

「人々が声を上げるのは容易になるが、聞き入れられるのは非常に困難になる」と、FCCのコメントを分析してきた政府関係管理会社FiscalNoteのアカウント・マネージャー、ザック・シュロス氏は言う。

現在、委員会がこの前例のないほど大量のコメントを精査しようとしているが、正当なコメントとボットのコメントを見分けるのは困難な作業になる可能性がある。

両側のボット

ネット中立性に関するコメント問題をめぐる騒動は、自動化の時代におけるオープンプラットフォーム管理の中心的な課題を浮き彫りにしている。ボットは、消費者にプラットフォームを統治するルールへの発言権を与えるはずのシステムそのものを乗っ取っている。しかし、ボットを排除することで、正当なコメントが危険にさらされる可能性がある。

これは、FacebookやTwitterのようなプラットフォームも直面している矛盾であり、プラットフォーム上の偽情報やスパム行為の根絶に取り組んでいる。しかし、これらの企業とは異なり、FCCなどの政府機関は、一般市民に規制策定プロセスへの参加機会を与える法的義務を負っている。また、一般市民のコメントに「提示された関連事項」を考慮することも義務付けられている。ボットがシステムを支配すれば、こうした関連コメントはかき消されてしまう。そして、言語生成ツールが高度化するにつれて、ボットを排除することはますます困難になる。有権者の声に耳を傾けることが法的に義務付けられている政府にとって、この混乱はまさに危機の醸成と言えるだろう。

「自然言語生成の現在の最先端技術は、かなり堅牢で、本物らしく聞こえます」と、FiscalNoteのリサーチ担当副社長であるVlad Eidelman氏は述べています。同社は、企業顧客が政府規制の新たな変更を予測できるよう、パブリックコメントの全履歴を分析しています。「一見正当に見え、正当だと感じられ、正当なメールアドレスから発信されたコメントを大量に生成することは可能ですが、それらは必ずしも国民の声を反映しているとは限りません。」

FiscalNoteは、ネット中立性に関する2,200万件のコメントをすべて分析し、いくつかの疑わしいパターンを発見しました。まず、歴史的な量の多さが挙げられます。さらに、これほど多くのコメントが5月23日と6月3日のわずか2日間に寄せられたという事実も挙げられます。

これらの異常性だけでは、コメントが偽物であると結論付けるには不十分でした。FiscalNoteの研究者たちは、自然言語処理技術を用いてコメントをグループ分けしました。コメントは感情(ネット中立性への賛成か反対か)によって分類されました。また、同一またはほぼ同一のコメントは、支援団体が会員に提出を促すことが多い定型文であると判断し、分離しました。さらに、文章を完全に重複させることなく同じテーマに触れているコメントも分析し、構成や語法の類似点を探しました。

彼らが見つけたのは、全く同じ文と段落構造を持ちながら、異なる単語を使って同じメッセージを伝えている数十万件のコメントでした。これは、規制環境に影響を与えるためのマッドリブス(マッドリブス)ガイドのようなものだと考えてみてください。すべてのコメントは、数十の選択肢から単語やフレーズを選び、それらをつなぎ合わせて段落を作ることで作成できます。

たとえば、この文の「regulate」という単語を「control」に置き換えると、2つの異なる文が得られます。

私はアジット・パイ氏に対し、前政権のインターネット管理計画を撤回するよう提唱します。

私はアジット・パイ氏に対し、前政権のインターネット規制計画を撤回するよう提唱します。

「ウェブ」を「インターネット」に置き換えると、別の言葉が生まれます。

私はアジット・パイ氏に対し、前政権のインターネット規制計画を撤回するよう提唱します。

コメント攻撃の背後にいるボットは、これらの文のバリエーションを束ねて短いコメントを作成しました。それぞれが異なっていましたが、すべて同じ順序で並んだ35個のフレーズで構成されており、各空白には最大25個の同義語やフレーズが挿入されていました。FiscalNoteはこのパターンに当てはまるコメントを数十万件発見しましたが、ボットがコメントを作成するために選択した可能性のある単語とフレーズの組み合わせは450兆通りにも上ります。

画像にはテキスト、ラベル、単語メニュー、番号、シンボル、プロットが含まれる場合があります

フィスカルノート

これはFiscalNoteが検出したパターンの一つに過ぎません。研究者たちは、同様のパターンを示す、ネット中立性を支持する別の一連のコメントを発見しました。ただし今回は、dearfcc.orgというウェブサイトを運営する電子フロンティア財団(Electronic Frontier Foundation)と関連していました。このウェブサイトは、FCCへの廃止に反対するコメントの投稿を呼びかけ、それに応じたメッセージを自動生成していました。自動生成されたコメントの内容は、ユーザーごとに異なっていました。

たとえば、FiscalNote の調査によると、そのコメントの 1 つの段落には、次のような選択肢が含まれていました。

FCCは、アジット・パイ委員長の[計画|提案]を[拒否|廃棄]すべきである。その計画は、[コムキャスト、AT&T、ベライゾン|コムキャスト、ベライゾン、AT&T|AT&T、ベライゾン、コムキャスト|ベライゾン、AT&T、コムキャスト|ベライゾン、AT&T、コムキャスト|ベライゾン、コムキャスト、AT&T]のような政府補助金を受けた[通信大手|ISP独占企業]に[データ差別を行う|好きなように速度を制限する|インターネットの高速レーンを作成する]権限を与え、[消費者|ユーザー|インターネットユーザー]から[必要な|有意義な|極めて重要な][アクセスとプライバシー|プライバシーとアクセス]の[保護|ルール|安全策]を奪うものである。つい最近勝ちました。

EFFの場合、自動化ツールは生身の人間がより効率的にメッセージを伝えるのに役立ちました。これは、少なくとも100万件の偽コメントを生成したボットとは大きく異なります。しかし、その効果はFCCのコメントシステムを圧倒するのにも役立ちました。「FCCにスパムを送るためにボットが違法または悪意を持って使用されているという指摘は以前からありました」とアイデルマン氏は言います。「しかし、自動化には両面性があります。」

ゼロから始める

だからこそ、FCC、そしてパブリックコメントの受付が義務付けられている他の政府機関にとって、これは非常に難しい問題となっている。しかも、これは比較的新しい問題でもある。2015年にFCCがネット中立性保護法案を可決し、電子コメント提出システムを開始した当時、最大の懸念は容量管理だったと、元FCC委員長トム・ウィーラー氏の元顧問、ジジ・ソーン氏は語る。ソーン氏によると、FCCが正当なコメントとそうでないコメントを区別すべきかどうかについて「バックオフィスでの話し合い」がいくつかあったが、「結局、前に進むことはなかった」という。

しかし、問題の解決はシステムのアップグレードほど容易ではないことを彼女は認めている。「内部から見てきた限りでは、彼らはゼロからやり直さなければならないと思います」とソン氏は言う。

これは、FCCがコメント投稿者が実在の人物であることを確認するために、例えば二段階認証システムのようなものを導入することを意味するかもしれません。一方、FiscalNoteは、FCCが真剣に検討する可能性に基づいて各コメントにスコアを付けるツールを開発中です。「グラビタススコア」と呼ばれるこのツールは、同社が数十年にわたるパブリックコメントを分析した結果に基づいています。FiscalNoteは、パブリックコメントがFCCの最終規則に反映されるために必要な条件を調査し、多くの場合、真剣な法的議論を含むコメント、または大企業や学術機関などの著名な組織と関係のあるコメントのみが採用されることを発見しました。この基準で言えば、例えばコメントがVerizonの法務顧問によって書かれた場合、そのコメントのグラビタススコアはより高くなるでしょう。

「我々の仮説では、当局は個々の投稿者よりもはるかに多くのコメントに注目している」とアイデルマン氏は言う。何らかの階層構造を作れば、少なくともFCCが2200万件ものコメントを精査するのに役立つだろう。この数では、FCCが実際に一つ一つを精査することは不可能だ。

もちろん、このようなシステムには独自の問題が伴うだろう。まず、FCCの注意を引く方法さえ理解すれば、悪意のある者が簡単に不正行為を行えるようになるだろう。しかし、そこにはより根本的な問題がある。FCCが弁護士や企業から提出された長文のコメントを、一般の人々が書いた短いコメントよりも重視するのは事実かもしれないが、本来のシステムはそう機能するべきではないとソーン氏は指摘する。

「じゃあ、高額な弁護士に依頼して書かなければ、何の価値もないってこと?」と彼女は言う。「短いからといって、価値がないわけではないんです。」

このアプローチは、一般市民が及ぼせる影響力を制限するだけでなく、政府にはあらゆる「関連事項」を考慮する義務があるため、規則制定を進める上でパイ委員長の法的立場を不安定にするとソン氏は指摘する。「短いコメントを完全に無視することは、裁判での彼の主張をより脆弱なものにする」とソン氏は指摘する。「記録の完全性に疑問が投げかけられており、裁判で彼に不利に働く可能性があり、実際にそうなるだろう。」

1946年に行政手続法が成立し、政府機関にパブリックコメントの受付を義務付けた当時、ボットが法の支配に大混乱をもたらす世界はSFの世界のようでした。しかし今日、それはFCC(連邦通信委員会)がもはや無視できない現実となっています。