Hearem 常见问题 - AI 语音阅读帮助

Question 1

Hearem 是什么？

Accepted Answer

Hearem 是一款面向 iPhone 和 iPad 的 AI 语音阅读器，用来把原本需要盯着屏幕阅读的内容，转换成可以连续收听的自然语音。它适合通勤、散步、做家务、复习资料、处理长文章，或在眼睛疲劳时继续获取信息。

你可以粘贴文本、读取剪贴板、扫描图片、导入 PDF/TXT/EPUB、粘贴网页链接，或通过 iOS 分享菜单把内容发送到 Hearem。生成语音时，可以选择 Apple 系统语音、多家 AI 音色或授权创建的克隆声音；生成后的音频可以像个人播放列表一样在后台和锁屏状态下继续播放。

Question 2

第一次使用，怎么开始朗读？

Accepted Answer

粘贴或输入文字，选择语言和声音，然后开始播放。你也可以扫描图片、导入文档、粘贴网页链接，或让 App 检测剪贴板内容。

Question 3

支持从微信或其他 App 导入文件吗？

Accepted Answer

支持。你可以在微信或其他 App 里打开文件后，使用“用其他应用打开”或 iOS 分享菜单把内容发送到 Hearem。

常见支持格式包括图片、PDF、TXT、MD、EPUB、DOC 和 DOCX，具体可用能力会随文件类型而变化。

Question 4

Hearem 免费吗？

Accepted Answer

可以免费使用。免费版支持 Apple 系统语音，并提供基础额度来体验文本朗读、图片扫描、网页朗读等核心功能。需要更高字符额度、高级 AI 音色、完整音色库或更多处理能力时，可以升级标准会员。

Question 5

开通会员后还有字数限制吗？

Accepted Answer

有。当前标准会员包含每月 1,000,000 基础字符，以及 20,000 高级语音字符，这两部分会分别计算。

基础字符会按订阅周期重置；未用完的高级语音字符可累积到下一次续订。如果仍然不够，也可以单独购买高级语音字符包扩充额度。

Question 6

一个月的额度不够用怎么办？

Accepted Answer

如果当月额度不够用，可以单独购买语音包来扩充额度。Hearem 目前提供小型字符包和大型字符包两档选择。

小型字符包包含 20,000 高级语音字符和 100,000 基础字符；大型字符包包含 130,000 高级语音字符和 800,000 基础字符。购买后的高级语音字符不会过期，并会立即加入当前余额。

这意味着付费用户在额度不够时可以按需继续补充，不会被单个月度额度卡住。

Question 7

为什么不同的音色消耗的额度不一致？

Accepted Answer

这是因为不同供应商、不同音色模型，甚至不同模式的底层成本并不一样，Hearem 会根据实际成本做额度折算，以控制整体服务成本。

例如 Apple 内置语音不消耗字符；部分高级音色会按更高倍率消耗，目前 ElevenLabs 是 3 倍消耗，Minimax 的增强模式是 2 倍消耗。

如果你更在意额度利用率，可以优先选择消耗更低的音色；如果你更在意自然度、表现力或特定效果，也可以选择高倍率的高级音色。

Question 8

需要登录吗？

Accepted Answer

需要。Hearem 目前需要登录后才能使用，当前支持通过 Apple ID 登录。登录用于确认你的账号、订阅状态、额度和购买记录，也方便后续恢复访问或处理支持问题。

Question 9

登录失败怎么办？

Accepted Answer

可以先完全退出并重新打开 Hearem，再确认网络连接是否正常。如果仍然提示登录错误，建议更新到最新版本，并在必要时卸载重装后重试。

如果问题持续存在，请附上设备型号、iOS 版本、App 版本和报错截图联系支持，通常会更快定位问题。

Question 10

卸载重装后，之前做好的音频还能恢复吗？

Accepted Answer

这取决于你之前是否已经保存、导出或同步过相关内容。如果你担心丢失现有内容，建议先导出不想丢失的音频，再进行卸载重装。

已启用并正常工作的历史同步或备份内容，通常可以在重新登录后恢复；没有保存到历史记录、草稿或备份的本地数据则可能无法找回。

Question 11

支持哪些语言和声音？

Accepted Answer

Hearem 支持多语言朗读，常见语言包括中文、英文、日文、韩文、法文、西班牙文、德文、葡萄牙文、意大利文、俄文、阿拉伯文、荷兰文等。具体可用语言会随你选择的语音供应商和音色而变化，可以在声音列表中查看和筛选。

声音大致分为几类：Apple 系统语音适合免费和基础朗读；Microsoft Azure 覆盖语言广；Minimax、Doubao、TikTok 和 Qwen 更适合中文或中英文内容；ElevenLabs、OpenAI 和 Fish Audio 提供更自然或更有表现力的高级 AI 音色。

如果你想使用自己的声音，也可以创建或使用已授权的克隆声音。不同音色模型对不同语言的支持范围和支持水平并不相同，支持的语速、音调、情绪、音量和音频标签等控制项也会不同，生成前建议先根据语言和场景选择合适的音色。

Question 12

日语内容里夹杂汉字时，为什么有时会读成中文？

Accepted Answer

在多语言内容里，汉字可能会被部分语音模型优先按中文发音处理，尤其是在语言倾向不够明确的时候。

不同音色模型对不同语言的支持范围和支持水平并不相同。有些更擅长中文，有些更擅长英文或日语，也有些在混合文本场景下更稳定。遇到这种情况，建议换一个更擅长目标语言的音色后再试。

Question 13

支持粤语吗？

Accepted Answer

支持。Hearem 提供粤语相关音色，部分中文语音还支持“中文发音优先使用粤语”这类设置。

具体效果会随供应商、音色和文本内容而变化；如果你主要想听粤语，建议优先选择明确标注粤语的音色，或在支持时开启粤语优先。

Question 14

方言发音不标准，怎么改进？

Accepted Answer

使用方言语音时，建议尽量用方言口语书写，也就是更接近“方言本字”的表达，而不是直接拿标准书面中文去读。

方言往往有自己独特的词汇、句式和语气。使用更地道的方言文本，通常能让 AI 更准确地还原方言发音和语感。

比如粤语可以把“他在做什么？”写成“佢喺度做咩？”，把“这个东西很好看”写成“呢样嘢好靓”。闽南语、上海话等也同理，越接近日常真实说法，效果通常越自然。

Question 15

什么时候可以用音频标签或语气/场景标签？

Accepted Answer

目前这类标签只在部分 ElevenLabs 音色上可用。先切换到 ElevenLabs 语音；如果该音色支持，就可以在生成时使用这些标签。Apple 语音和多数其他供应商暂不支持相同的标签控制。

Question 16

可以听电子书或长文吗？

Accepted Answer

可以。导入电子书、长文章或长文档后，Hearem 会根据你选择的语音供应商的单次文本长度限制自动拆分并依次生成音频，不需要你手动分段、分批 TTS。

处理完成后，你可以连续收听完整长文；如果需要，也可以把生成的多个片段合并导出成一个音频文件。

Question 17

为什么有些语音会在后台生成，有些会直接等待完成？

Accepted Answer

不同语音服务对长文本的处理能力和返回速度不一样。为了让生成过程更稳定，Hearem 会根据文本长度和所选声音，自动选择两种模式：短文本通常会直接等待生成完成，结果会更快返回；较长文本会进入后台生成队列，以避免请求超时、生成中断，或因为服务商限制导致失败。

目前的切换临界点是：MiniMax、Azure、ElevenLabs、FishAudio、Gemini、Doubao 超过 500 字后进入后台生成；Qwen、TikTok 超过 300 字后进入后台生成。这里的“超过”指文本字数大于临界点，例如 500 字以内会尽量直接生成，501 字及以上会走后台生成。

这些数值会根据各服务的稳定性和速度持续调整，目标是在尽量快的同时保证长文本生成成功率。

Question 18

为什么长文本生成时会失败，或者卡在下载音频？

Accepted Answer

长文本生成失败有时不是朗读本身出错，而是卡在后续音频下载、合并或保存阶段。遇到这种情况，建议先到历史记录中查看失败记录，必要时重试或重新导出。如果同一段长文本反复失败，最好把文本内容、所选语音和失败截图发给支持，便于定位具体环节。

如果你在中国大陆使用部分海外语音服务，网络问题也可能导致生成失败、超时或下载卡住。遇到这种情况，建议先切换到更稳定的网络环境；如果对应服务商在当前网络下受限，可以尝试使用稳定代理或 VPN 后再试。

Question 19

PDF 或文档朗读会消耗额度吗？

Accepted Answer

OCR 识别本身和后续朗读是两件事。OCR 本身不会消耗字符额度；只有在识别后的文本真正进入语音生成时，才会按所选语音方案消耗对应字符额度。

具体消耗取决于你使用的是基础语音还是高级语音，所以长文档在开始生成前，建议先确认所选音色和剩余额度。

Question 20

从相册或图片导入内容时，为什么有时会失败？

Accepted Answer

如果图片文件还在 iCloud 中、尚未完整下载到设备本地，相册或附件导入时可能会失败。

遇到这种情况，建议先确认图片已经下载到本地，再重新选择导入。若问题只出现在特定格式或个别图片上，也可以把样例文件发给支持检查。

Question 21

支持后台和锁屏播放吗？

Accepted Answer

支持。已生成的音频可以在锁屏、切出 App 或做其他事情时继续播放。

Question 22

可以离线听吗？

Accepted Answer

生成语音通常需要网络连接。音频生成完成后，可以离线收听已保存或已生成的内容。

Question 23

可以导出音频吗？

Accepted Answer

可以。生成后的音频可以保存为文件，也可以分享给其他 App。

Question 24

播放界面的调速，会改变导出的音频文件吗？

Accepted Answer

不会。播放界面的倍速调整主要影响收听时的播放速度，不会直接改写已经生成好的原始音频文件。

若你需要导出后仍保持特定速度，可以在支持变速播放或二次处理的播放器中继续使用，例如 VLC、nPlayer 等。

Question 25

可以导出字幕文件吗？

Accepted Answer

可以。如果该条音频记录带有字幕，你可以在历史记录或播放器菜单里导出字幕文件。

对于分段生成的长文本内容，也可以按片段导出，或合并导出完整字幕。

Question 26

可以同时保存多篇内容或整理历史记录吗？

Accepted Answer

可以。你可以先保存草稿，之后继续编辑或生成；已经生成的音频会保存在历史记录里。

如果内容越来越多，还可以用专辑功能整理不同文章、书籍或主题。

Question 27

支持语音克隆吗？

Accepted Answer

支持。你可以上传授权的语音样本来创建个人声音。请只克隆你自己的声音，或已获得明确授权的声音。

Question 28

克隆声音会消耗什么额度？

Accepted Answer

克隆声音属于高级语音模型，使用它朗读时会消耗高级语音字符，而不是基础字符。

首次开通标准会员会赠送一次声音克隆；如果后续继续高频使用克隆声音，建议一并关注高级语音字符余额。

Question 29

克隆声音的情绪比较平，怎么让它更像我？

Accepted Answer

克隆声音的情绪和语气，很大程度取决于你录制时提供的样本。如果样本本身比较平，AI 往往也会学到比较平的表达方式。

录制时不一定非要读参考文本，可以朗读任意内容，最长可录到 5 分钟。若你希望它读出悲愤、激昂、热情、平静等不同语气，建议在样本里就把这些情绪、节奏和表达方式录进去。

通常来说，样本更长一些、内容更丰富一些、情绪变化更多一些，会更有助于 AI 学习你的声音和说话方式。

Question 30

为什么长文朗读有时会从中间开始、跳段，或重复某一段？

Accepted Answer

这类问题通常和原始文本结构、分段边界或生成过程异常有关。若发现长文从中间开始、重复某一段，或前后不连续，建议保留原文并把对应记录发给支持排查。

如果生成结果和原文有大篇幅不符、乱读或奇怪噪音，还可以在播放器菜单最底部点击“音频结果有误？申请退回额度”。提交后会进入人工审核，审核通过后会退回这次生成所消耗的额度。

Question 31

可以调节语速、音调或情绪吗？

Accepted Answer

可以。Hearem 支持基础播放速度控制；部分高级 AI 音色还支持情绪、音调、音量等更细的参数。

Question 32

App 闪退怎么办？

Accepted Answer

如果 App 在启动后立即闪退，或者进入某个页面后反复崩溃，建议先完全退出并重新打开 App，再确认是否已经更新到最新版本。若问题仍然存在，可以尝试重启设备后再试。

如果你准备卸载重装，建议先尽量导出或确认已同步好不想丢失的内容。若仍反复闪退，请把设备型号、iOS 版本、App 版本、闪退前的操作路径，以及能提供的录屏或截图一起发给支持。

Question 33

订阅后额度没有刷新怎么办？

Accepted Answer

请先重启 App，再到用户中心或订阅页面刷新购买状态。如果仍未恢复，请带上购买记录、设备型号和 App 版本联系支持。

Question 34

网页朗读失败怎么办？

Accepted Answer

部分网页有登录、付费墙或反抓取限制。遇到这种情况，可以在浏览器中打开页面，复制正文后粘贴到 Hearem。

Question 35

我的数据是否私密？

Accepted Answer

Hearem 尽量采用本地优先设计。OCR 默认在设备上完成；使用第三方 AI 语音或语音克隆时，只会把必要内容发送给对应服务商处理。

Question 36

支持 Android 吗？

Accepted Answer

目前主要支持 iOS。Android 是否推出取决于后续需求和开发安排。