“Speechify”如何进化为无需手动操作的 AI 助理
2026 年 3 月 3 日
开发者故事

语音引导
“Speechify”的定位是一款全天候 AI 助理,集 AI 语音聊天、文本转语音及语音输入于一体,力求实现完全脱离键盘的交互体验。
凭借一系列机器学习工具与功能,这款 2025 年 Apple 设计大奖“多元包容”类别的获奖作品现在已成为覆盖办公、教育及娱乐场景的 AI 语音解决方案。
创始人 Cliff Weitzman 表示:“我们的使命是打造一款全能型语音 AI 助理,帮助用户在工作或学习的各个环节充分释放潜力”。
用户可使用“Speechify”处理 PDF、epub 和网页等多种文件格式,并将文本转化为可自由调节语速、能在不同设备上播放的音频。这款 App 基于 SwiftUI 构建,提供 60 种语言、1000 多种语音,均由团队专有的 SIMBA 文本转语音模型提供支持,并利用 Core ML 与设备集成。这种策略不仅能让用户在本地访问语言资源,更显著提升了公司运营效率。“Apple 芯片帮助我们大幅降低了成本,”首席财务官 Pankaj Agarwal 说。
Speechify
- 兼容平台: iPhone、iPad
- 团队规模: 200 人
- 公司总部: 迈阿密
- 荣获奖项: Apple 设计大奖“多元包容”类别获奖作品 (2025 年)
在其他方面,“Speechify”运用 Metal 技术 (用于将扫描页面展平以便朗读)、SwiftData 以及具备结构并发能力的 Swift 6。通过利用 App Intents,这款 App 还支持用户导入文本和 URL、使用“聚焦”搜索、恢复播放、浏览库等。
“语音 AI 可以让人们在工作和学习中的效率提高十倍,”Cliff 的兄弟、公司总裁 Tyler Weitzman 表示,“我们希望‘Speechify’成为全球用户首选的语音 AI 助理和语音操作系统。”

创始人 Cliff Weitzman 表示:“我们的使命是打造一款全能型语音 AI 助理,帮助用户在工作或学习的各个环节充分释放潜力”。
“Speechify“创始人的初衷并非成为机器学习领域的先驱,而是为了帮助自己克服学习障碍。2017 年,Cliff 还是一名试图战胜自身学习障碍的大学生;他在小学三年级时被诊断出患有阅读障碍,后来又被确诊患有注意力缺陷多动障碍 (ADHD)。“但我深知,要成为自己想成为的人,我必须能够阅读,”他说道,“因此,我无论到哪儿都随身带着一本书,幻想着有一天我能真正读懂它。”
随着年龄增长,Cliff 发现自己通过听觉吸收信息的效果最好。进入布朗大学后,他开始借助 iPhone 上的文本转语音程序完成阅读作业——而这催生了“Speechify”App 的初始版本。该 App 的设备端 AI 语音模型由 Tyler 构建。Tyler 左眼失明,也借助这款 App 来应对自身的阅读障碍。不到十年时间,已有超过 5000 万人下载了这款 App。
在 App 开发的初期,Weitzman 花了很多时间亲自倾听用户反馈。“最初几个版本其实有个‘向团队发送消息’按钮,点击后会直接打开我的个人 iMessage 信息,用户可以直接和我聊天,”Weitzman 回忆道,“每当他们遇到错误或有反馈意见时,我都能立即收到。后来,因为收到的 iMessage 信息实在太多了,只好请人重设了账户。”

“Speechify”的新产品包含一项由 AI 支持的功能,可以根据任何提示词或文档创建定制播客。
虽然学生群体在“Speechify”早期用户中占了相当大的比例,但如今该 App 在课堂之外也广受欢迎,无论是时间紧张的单亲父母、事务繁忙的企业高管,还是需要随时随地学习的警察和消防员,
都纷纷借助“Speechify”来简化工作和学习方式,正如 Weitzman 在学生时期初次尝试文本转语音技术时所做的那样。
“我们不会停下脚步,”Cliff 说,“只为让全球数十亿需要‘Speechify’的人在学习、工作和生活中都能获得应有的支持。”