LocalSub - YouTube 本地 AI 字幕翻译
概述
本地 AI 转录任何 YouTube 视频并翻译成你的母语。100% 本地运行,无需 API Key,初始化后无需联网。
不再为了阅读而上传音频。 大多数YouTube字幕扩展会将你的视频URL或音频发送到服务器、记录你的活动、将功能锁定在登录后面,或者在离线时停止工作。如果你每天都在看教程、讲座、技术演讲或外语内容,这会导致依赖、速度变慢,以及你从未同意过的隐私权衡。 LocalSub采取不同的方式。转录模型和翻译模型都在你的浏览器中运行,在你的机器上运行。你的音频永远不会离开Chrome。 为什么YouTube字幕比看起来要复杂 YouTube有很多视频的字幕,但体验参差不齐: - CC字幕是错误的语言 - 自动生成的字幕质量差且未翻译 - 视频完全没有字幕(新上传、播客、屏幕录制很常见) - 官方翻译会丢失技术术语和专有名词 - 你想要一个干净的SRT或TXT文件用于笔记,但页面只显示文本覆盖层 - 你想要原文和翻译并排显示,而不是只有其中一个 大多数工具只能解决部分问题,并创造新的问题——它们需要API密钥、将你的音频上传到未知服务器、在看几个视频后强制付费,或者在YouTube更改播放器脚本时破损。 LocalSub的设计目的是在一个面板中全部解决,而不需要将音频发送到任何地方。 这个扩展的功能 LocalSub在YouTube中添加一个侧边栏,按照以下顺序做三件事。 它在存在时直接从播放器读取YouTube现有的字幕,包括自动生成的字幕。 如果没有字幕轨道,它使用Whisper在本地转录音频——同一个开源语音模型被许多专业转录工具使用——完全在你的浏览器中通过WebAssembly运行。 然后它使用NLLB-200将每个片段翻译成你选择的目标语言,NLLB-200是来自Meta AI Research的200种语言模型,也在本地运行。当模型无法在较小设备上适应内存时,面板会自动切换到免费公共翻译端点,这样工作流永远不会中断。 你会得到: 本地Whisper转录——适用于没有字幕、没有签名音频令牌且没有第三方转录服务的视频。 本地NLLB-200翻译——19种目标语言,包括英语、德语、法语、西班牙语、意大利语、葡萄牙语、荷兰语、俄语、波兰语、土耳其语、阿拉伯语、日语、韩语、简体中文和繁体中文、印地语、泰语、越南语和印度尼西亚语。 侧边栏UI——保持视频在原位,字幕在该在的位置,在一列中,你可以在视频播放时阅读。 可点击的字幕——每个片段都是一个时间戳;点击它,视频会跳转到源标签页中的那一刻。 双语渲染——默认情况下,每个片段在顶部显示翻译行,下面显示原始行,这样你可以逐字匹配翻译和源文本。 SRT导出——生成标准字幕文件,你可以将其放入VLC、Premiere、DaVinci Resolve或任何其他地方。 TXT导出——生成没有时间戳的干净阅读字幕,对笔记应用、AI聊天或分享很有用。 导出模式选择器——一键切换双语、仅翻译或仅原文,适用于SRT和TXT。 14种UI语言——面板本身支持英语、简体中文、繁体中文、日语、韩语、德语、法语、西班牙语、巴西葡萄牙语、意大利语、阿拉伯语、荷兰语、俄语和土耳其语。 工作原理 1. 在youtube.com上打开任何视频。 2. 在侧边栏中选择你的目标语言——你只需要做一次。 3. 点击视频标题旁的"转录+翻译"。 4. 等待管道——获取、转录(如需)、翻译。 5. 阅读字幕,点击任何行跳转到那一刻,或导出到SRT或TXT。 这就是整个流程。没有账户要创建、没有API密钥要粘贴、没有信用卡要添加。 为什么是侧边栏而不是弹出窗口 弹出窗口在你点击任何其他地方时会消失,这正是你在拖动视频、切换标签页或打开描述时所做的。侧边栏保持打开,与视频共享同一窗口,并为字幕提供足够的垂直空间,使其可读且不被截断。它还允许你复制长行,而面板不会在你的光标下关闭。 导出模式详解 双语——每个片段两行。对于需要验证翻译与源文本的语言学习者和翻译工作者很有用。 翻译——仅目标语言。对于干净阅读和将SRT提供给不支持多行样式的播放器很有用。 原文——仅源语言。当视频已经有很好的字幕且你只想要干净的SRT或TXT、不需要AI改写时很有用。 活动模式适用于SRT和TXT导出,所以你不必切换两次。 真实场景中的帮助 观看只有韩语自动字幕的90分钟韩语开发演讲: LocalSub从播放器读取韩语轨道,将每行翻译成你的语言,让你点击回到重要时刻。无需上传,无需等待队列。 跟随没有字幕的德语大学讲座: 页面没有CC轨道。LocalSub进入音频,在你的机器上运行Whisper,生成时间戳片段。然后你导出SRT并加载到你选择的播放器。 学习嵌入在YouTube上的日语播客片段: 你想要双语字幕来跟读。LocalSub转录日语,翻译成英语,导出双语SRT。你将其放入VLC,用双轨观看。 在你的母语中浏览四小时英语课程: 你只有时间看亮点。LocalSub在侧边栏中为你提供可点击的字幕;你扫描、点击、观看相关的30秒、继续。 保存阿拉伯语新闻视频供后续阅读: 你想要文本形式的文章。以原文模式导出TXT,粘贴到你的阅读应用,完成。 从西班牙语采访中捕获写作引用: 点击片段,视频跳转,你确认发言人,你将双语行复制到你的草稿中。无需重新听12分钟的片段来找一个句子。 这个扩展不做什么 它不会将你的音频上传到任何外部转录服务器。 它不需要Google、OpenAI或LocalSub账户。没有登录。 它不会跟踪你的观看历史、与分析共享数据,或对你的浏览器进行指纹识别。 它仅使用的权限: - storage——记住你的目标语言和侧边栏状态。 - downloads——当你点击导出时保存SRT和TXT文件。 - activeTab和tabs——让侧边栏知道你在哪个YouTube标签页上,这样当你点击片段时它可以跳转视频。 - scripting——注入小读取器,从YouTube播放器中提取字幕。 - sidePanel——打开字幕面板,不接管页面。 - youtube.com和googlevideo.com——需要从播放器读取字幕和音频。 - huggingface.co和相关CDN——在首次运行时使用一次,将Whisper和NLLB-200模型文件下载到你的浏览器缓存。 - translate.googleapis.com——仅在本地NLLB模型无法适应当前设备上的WebAssembly内存时作为备选使用。 这就是完整的列表。在一次性模型下载后,转录和翻译视频不需要进一步的网络调用。 定价 LocalSub是免费的。没有每日限制、没有按视频付费墙、没有隐藏导出按钮的高级层。 模型下载一次并存储在你的浏览器缓存中。之后,转录和翻译可以离线工作,有一个小警告:如果你的设备无法在本地容纳NLLB-200,公共翻译备选需要网络。 幕后原理 转录:Whisper-base,q4量化,约142 MB。 翻译:NLLB-200蒸馏600M参数,q4量化,约240 MB。 运行时:transformers.js与onnxruntime-web,可用时使用WebGPU,否则使用WebAssembly。 字幕备选:播放器上的fetch和XHR钩子,这样扩展读取播放器本身刚刚下载的相同字幕流,而不是重新请求受保护的timedtext端点。 翻译备选:当WebAssembly无法在较小机器上为NLLB分配足够内存时,面板为该会话切换到公共Google翻译端点。 没有隐藏的云工作器、没有代理服务器、没有遥测信标。代码足够直接,你可以在安装前阅读。 这是给谁的 - 想要每个视频上都有双语字幕的语言学习者,而不仅仅是有翻译CC的少数几个。 - 观看不同语言讲座和会议演讲且需要干净SRT或TXT做笔记的研究人员和学生。 - 跟随其他语言教程且想要时间戳、可导出字幕的开发者和创意工作者。 - 观看源语言视频且想要快速方式在自己的语言中阅读它们的旅行、金融和新闻观众。 - 更看重隐私、希望音频保留在浏览器内的用户。 开始使用 安装扩展,如果你喜欢就固定它,打开YouTube视频,在侧边栏中选择你的语言,点击"转录+翻译"。首次运行会下载模型;之后的每次运行都是本地的。 没有账户。没有注册。没有信用卡。只需按按钮。
0 星(5 星制)无评分
详情
- 版本0.1.1
- 上次更新日期2026年5月4日
- 提供方monetgen.com
- 大小7.95MiB
- 语言14 种语言
- 开发者
邮箱
monetgen.com@gmail.com - 非交易者该开发者尚未将自己标识为交易者。欧盟地区消费者须知:消费者权利可能不适用于您与该开发者达成的合约。
隐私权
该开发者已声明,您的数据:
- 不会因未获批准的用途出售给第三方
- 不会为实现与产品核心功能无关的目的而使用或转移
- 不会为确定信用度或放贷目的而使用或转移