「Speechify」:ハンズフリーのAIアシスタントへの進化のプロセス

デベロッパストーリー

Three iPhone screenshots from the app Speechify, all showing UI of how the app reads printed text aloud. The screenshots are all against a dark black and purple background.

音声がひらく可能性

音声AIチャット、テキスト読み上げ、音声入力などの機能を備えたSpeechifyは、キーボードを一切必要としない、いつでも利用できるAIアシスタントを目指しています。

さまざまな機械学習ツールや機能を活用したSpeechifyは、2025年Apple Design Awardsをインクルージョン部門で受賞しており、仕事や教育、エンターテインメントの分野でAI音声アシスタントとしての役割を果たしています。

「私たちの使命は、仕事や学習のあらゆる場面で、ユーザーが潜在能力を最大限に発揮できるよう支援する音声AIアシスタントを開発することです」と、創業者のCliff Weitzman氏は語ります。

Speechifyを利用すれば、PDFやEPUBファイル、Webページなどさまざまなファイルフォーマットを扱い、テキストを音声に変換して、再生速度を自在に調整したり、別のデバイスで再生したりすることができます。SwiftUIで構築されたこのアプリは、60の言語で1,000種類以上のボイスを提供しており、すべてチームが独自に開発した「SIMBA」テキスト読み上げモデルを基盤としています。このモデルは、Core MLを活用してデバイスと連携します。この戦略により、ユーザーはデバイス上でさまざまな言語を利用することができ、企業の運営効率も高まります。「Appleチップのおかげで、コストを劇的に削減することができました」と、CFOのPankaj Agarwal氏は語っています。


Speechify

  • 対応デバイス:iPhone、iPad
  • チームの規模:200人
  • 拠点:マイアミ
  • 受賞歴:Apple Design Awards(2025年、インクルージョン部門)

Speechifyについてさらに詳しく>

App StoreからSpeechifyをダウンロードする>


またSpeechifyは、Metal(スキャンしたページを平坦に補正して読み上げるため)、SwiftData、およびSwift 6を利用して、構造化並行処理を行っています。さらにApp Intentを活用することで、テキストやURLの取り込み、Spotlightでの検索、再生の再開、ライブラリの閲覧なども行えるようになっています。

「音声AIは、仕事や教育の場面で生産性を10倍に高めることができます」と語るのは、Cliff氏の兄弟で社長を務めるTyler Weitzman氏です。私たちは、Speechifyが世界中の人々に選ばれる音声AIアシスタントおよび音声オペレーティングシステムとなることを願っています。

A photo of Speechify founder Cliff Weitzman, who is wearing a blue hoodie and standing against a gray wall.

「私たちの使命は、仕事や学習のあらゆる場面で、ユーザーが潜在能力を最大限に発揮できるよう支援する音声AIアシスタントを開発することです」と、創業者のCliff Weitzman氏は語ります。

Speechifyのクリエイターは、機械学習の分野で先駆者になることを目指したわけではなく、自分たち自身が直面していた問題を解決するために開発を始めました。2017年、大学生だったWeitzman氏は、自分自身の学習にまつわる問題を克服しようと努めていました。小学3年生の時に失読症と診断され、後にADHDであることも判明していたからです。「でも、なりたい自分になるためには、読む力が必要だとわかっていました。そのためいつも本を小脇に抱えて歩き回り、いつか読めるようになると想像し続けていました」

Weitzman氏は、自身が成長する過程で、情報は耳で聞くほうが自分の頭に入りやすいことに気付いたと言います。ブラウン大学に入学すると、iPhoneのテキスト読み上げプログラムを利用して読書の課題をこなすようになり、その工夫が「Speechify」誕生のきっかけとなりました。このアプリのオンデバイスAI音声モデルを開発したTyler氏は、左目が不自由なため、読書にまつわる自身の課題を克服するためにこのアプリを利用しています。そしてわずか10年足らずの間に、このアプリは5,000万人以上の人々にダウンロードされました。

Weitzman氏はアプリ開発の初期の頃、自ら多くのユーザーの声に耳を傾けていました。「最初のバージョンには『チームにメッセージを送る』というボタンがあり、それを押すと私のiMessageが開いて、ユーザーが私と直接チャットできるようになっていました」と、Weitzman氏はふり返ります。「ですからユーザーがバグに気づいたり、フィードバックがあったりすると、すぐ私の耳に入りました。最終的にはiMessageが多くなりすぎたので、スタッフにアカウントのリセットを頼むはめになりました」

A series of four Speechify screenshots on iPhone, showing various parts of the the app’s ability to help people record and create podcasts.

Speechifyの新機能には、あらゆるプロンプトやドキュメントからカスタムポッドキャストを作成できるAI活用型の機能も含まれています。

Speechifyの初期のユーザー層は学生が中心でしたが、現在では学生以外にも、時間に追われるひとり親や多忙なビジネスエグゼクティブ、移動中にも知識を吸収する必要がある警察官や消防士など、幅広い層に利用されています。

Weitzman氏が学生時代、音声読み上げ技術を使って試行錯誤を始めたと同じように、さまざまな背景を持つユーザーが、仕事や学習をもっとシンプルにするためにSpeechifyに辿り着いたのです。

「私たちの歩みが止まることはありません」とWeitzman氏は言います。「世界中で学校や仕事、日常生活にSpeechifyを必要とする何十億人もの人々にこのサービスを届けられるまで、取り組みを続けていきたいと思います」