米国アクセシビリティ委員会:AIとアクセシビリティに関する大統領令 [JA]

使用可能な言語: EN, JA

このページは英語の原文記事の翻訳です。なお、ナビゲーションは英語のみで提供されていますのでご了承ください。

AIを活用したアクセシビリティと支援技術の利用に関する過去の意見(NISTおよびPCASTの公募への貢献を含む)を踏まえ、米国アクセシビリティ委員会と民主主義技術センターが主催する公聴会への意見提出を要請されました。本公聴会は、障害コミュニティのメンバーやAI実務者と連携し、AIのリスクと利点について学ぶため、人工知能利用に関する大統領令の履行に向けたアクセス委員会の取り組みを支援するものです。

更新情報:当方の見解は、連邦通信委員会(FCC)における公聴会においても、2010年制定の「21世紀通信・映像アクセシビリティ法(CVAA)」に関する審議の中で、消費者技術協会(CTA)によって引用されました。

関連情報

NIST:生成AIプロファイル(AI 600-1)およびAIリスク管理フレームワーク(AI RMF)

PCAST:生成AIワーキンググループ(更新版)

WEF:アクセシビリティにおける生成AIの可能性 (1, 2, 3, 4, 5, 6)

WHO:大規模マルチモーダルモデルに関するガイダンス

技術的応用と実装

適応型コミュニケーションのための大規模言語モデル

トランスフォーマーベースの言語モデルは、注意機構を用いて適応的でパーソナライズされた対話を実現します。これは認知障害、自閉症、または発話困難のあるユーザーにとって極めて重要です。これらのモデルはコンパクト(70億パラメータ)から大規模(1,750億以上)まで存在し、LoRAやQLoRAといった効率的な手法を用いて障害特化データで微調整可能です。これによりモデル全体の再学習なしにパーソナライズを実現できます。新しいアーキテクチャは長時間の対話におけるユーザー履歴・嗜好の記憶により、拡張会話もサポートします。

環境理解のための視覚言語モデル

CLIP、BLIP-2、LLaVAなどのVLMsは、リアルタイムの視覚シーン理解とナレーション能力を示しています。これらのモデルはクロスアテンション機構を通じて視覚データとテキストデータを相互処理し、最適化されたエッジデバイス上で100ms前後の遅延推論パイプラインを実現する可能性があります。応用例には、視覚障害者向けの即時シーン描写、物体認識システム、セマンティックシーングラフによる空間推論を組み込んだ状況認識ツールが含まれます。

代替フォーマット生成のためのマルチモーダル生成

Bark、VALL-E、Tortoise TTSなどのテキスト音声変換モデルは、視覚障害や読字障害を持つユーザー向けの動的コンテンツ変換能力を示しています。これらのニューラル音声合成システムは、音声クローン、感情トーン適応、多言語出力をサポートします。文書処理パイプラインとの統合により、学術論文、法律文書、ウェブコンテンツを意味構造を保持したアクセシブルな音声フォーマットへ自動変換が可能となります。

手話処理のためのコンピュータビジョン

SignBERTや手話トランスフォーマーアーキテクチャなどの専門モデルは、姿勢推定と時系列モデリングを通じてアメリカ手話(ASL)やその他の手話を処理します。これらのシステムは、MediaPipeを用いた手の追跡とトランスフォーマーベースの時系列テキスト変換を組み合わせ(現在の研究では制御環境下で有望な精度を達成)、聴覚障害者向けのほぼリアルタイム通訳サービスや教育アプリケーションを可能にする可能性があります。

認知支援のための生成モデル

認知支援アプリケーション向けに微調整されたGPTベースモデルは、記憶障害、ADHD、実行機能障害を持つユーザーを支援する新たな可能性を示しています。技術的実装には、複雑なタスクを管理可能なステップに分割するプロンプトエンジニアリングフレームワーク、文脈持続のための記憶拡張アーキテクチャ、標準化APIを介したカレンダー・リマインダーシステムとの統合が含まれます。

適応型インターフェース生成

LayoutLMやUI特化型言語モデルは、アクセシブルなユーザーインターフェースの自動生成を可能にする可能性があります。これらのシステムはユーザー操作パターンとアクセシビリティ要件を分析し、フォントサイズ・色コントラスト・ナビゲーション構造・入力方式を適応的に調整します。実装にはWCAG 2.1 AA準拠要件に基づくリアルタイムDOM操作とCSS生成が含まれます。

*以下の技術的能力は、現在の研究方向性と新たな展開可能性を示すものであり、実用化準備度はアプリケーションの複雑さや展開制約によって異なります。

安全性とトレーニング環境

アクセシビリティ分野における生成AIの展開には、制御されたトレーニング環境と規制監督の両方を包含する包括的な安全フレームワークが必要です。Habitat、Isaac Sim、およびアクセシビリティ特化プラットフォームを含むシミュレーターは、物理的に正確なシミュレーションとフォトリアリスティックなレンダリングにより、制御された研究環境下での生成AI支援エージェントの安全かつスケーラブルな訓練を可能にする場合があります。これらの高忠実度環境は、PhysXやBulletなどの高度な物理エンジンを通じて、補助機器の操作、車椅子のナビゲーションダイナミクス、適応型インターフェース動作を組み込み、多様な障害シナリオにわたるテストを支援します。

障害特異的な相互作用やコミュニケーションパターンを捉えた堅牢なデータセットは、アクセシビリティニーズを効果的に満たすシステム訓練に不可欠です。Common VoiceやOpenAssistantなどの現行データセットは、マルチモーダルなアクセシビリティシナリオ、発話パターンの多様性、代替コミュニケーション手法を網羅した障害特化型アノテーションによる大幅な拡張を必要とします。アノテーション基準には、多様な障害タイプと交差するアイデンティティにわたるアクセシビリティ機能、コミュニケーション嗜好、相互作用成功指標を含め、包括的なモデル開発を保証しなければなりません。

アクセシビリティ委員会の監督は、規制サンドボックスが障害関連データセット向けに特別に調整されたバイアス検出システムを包含し、歴史的な排除パターンの永続化を防ぐことを保証すべきです。規制枠組みの要件は、セクション508、ADA要件、新興AI安全基準を含む複数のコンプライアンス次元を統合するとともに、医療関連アプリケーション向けの医療機器規制を組み込む必要があります。データ保護枠組みは、差分プライバシーとフェデレーテッドラーニング手法を通じて機微な健康情報を扱い、開発・展開ライフサイクル全体でのユーザーの安全性とプライバシーを確保しなければなりません。

意見:

  • アクセシビリティに焦点を当てたテストベッドを確立 障害特異的なユースケース(例:認知負荷評価、義肢装置統合、緊急通信プロトコル)をモデル化し、支援技術開発者向けの標準化されたAPIを備える

  • 包括的なデータセットキュレーションを支援 補完的コミュニケーションパターンや認知支援シナリオ向けにプライバシー保護型アノテーション基準を採用し、現実世界のアクセシビリティインタラクションを捕捉する

  • アクセシビリティ重視の生成AIアプリケーション向け専門規制テストベッドを立ち上げる セクション508準拠、バイアス軽減、緊急通信効果性を検証する管理環境を提供する

これらの取り組みは、生成AIが全ての市民に奉仕することを保証する広範な取り組みを反映しています。技術基準の推進、規制の整合性、障害コミュニティを中心としたデータセットキュレーションを通じて、補助技術が後付けではなくデジタル公平性の推進力となる未来を形作ることができます。このビジョンを公共・民間・市民セクター全体で実現するには、継続的なマルチステークホルダーの関与が不可欠です。

• • •

参考文献

¹ 米国アクセシビリティ委員会.「人工知能」. 米国アクセシビリティ委員会公式AIページ. 2024年.

² ホワイトハウス.「安全で信頼性の高い人工知能の開発・利用に関する大統領令」. 大統領令14110号. 2023年10月30日。

³ 米国国立標準技術研究所.「NIST AIリスク管理フレームワーク向け生成AIプロファイル」. NIST AI 600-1. 2024年4月。

⁴ 米国議会.「2010年21世紀通信・映像アクセシビリティ法」. 公法111-260. 2010年。

⁵ 米国アクセシビリティ委員会.「セクション508基準」. 36 CFR Part 1194。

⁶ 米国司法省.「1990年アメリカ障害者法」. 公法101-336. 1990年。

⁷ 米国アクセシビリティ委員会.「米国アクセシビリティ委員会、人工知能(AI)の公平性・アクセシビリティ・包括性に関するシリーズ開発の一環として公聴会を開催」2024年8月28日。

⁸ 米国アクセシビリティ委員会.「米国アクセシビリティ委員会、障害者コミュニティ及びAI実務者向け人工知能(AI)に関する予備調査結果を発表」2025年1月14日。