有没有浏览器插件可以把视频教程直接变成文本?
- 0次
- 2021-06-10 20:13:27
- idczone
感觉看视频教程太占时间,有没有可抗投诉服务器以直接将视频里的声音通过语音识别直接转成文本的浏览器插件或者工具?
这是一个浏览器插件能搞定的问题吗?????
为什么不直接看书?
你需要全部拉下来然后才能转(
而且我认为不如直接找文本教程,视频教程质量中位数和平均值均较低
没有 要不你写个?
视频网站的流显然可以由插件来处理,需要做的比视频网站视频下载工具更多一步语音识别的步骤而已。
讯飞提供了上传音频提取音频的文本在线服务,有钱就行。
视频提取音频很容易,随便找个工具就成。
你觉得这种类型的操作,有插件可以免费给你做?
那请自己做一个吧
既然您说了“而已”,那就只能请您亲自出马了。
我也没说找免费服务和工具吧?
这种需要手动处理的太多,我先要把视频站的流下载,再转音频,再去上传。不过如果没有合适的工具,就只有自己动手了。
如果一些语义错误的话还要去倒视频,感觉反而变得麻烦了
试试几款给视频加字幕的软件就明白了,这活不简单。
很多人苦于 SEO 没内容,而视频中的内容呢,多数是小编编写的,所以很多人瞄向这块内容。
讯飞或者百度之类(未查询)的有这块方面的 API,通过提交音频,然后去转成文字。
视频下载呢,有嗅探类软件。
格式转换类工具,比如格式工厂 可能可以直接转音频。
转换好的音频呢,通过 python 编写脚本代码,将其输出保存为文字的话,也很方便,网络上有很多类似的教程。
哦 对了 ,上面说的这个方法,估计仅限于汉语,而且是标准普通话,不保证准确度。
请您写一个造福大家吧
一帧一帧的载下来吗
这类内容农场,机智
淘宝有相关服务
关于内容农场:还有知网、万方、维普等之类的东西。
现在 5118 的内容规划神器免费开放了,又是一个内容编写利器。
百度站长工具后台的关键词规划师,谷歌站长工具后台的关键词规划师,百家号里也出了一个关键词工具,同时还能搜索其他包含这块内容的文章。
可以做到但没必要,所以没有
视频本身提供字幕的话,好解决
像 youtube 大部分视频都可以
到 greasyfork 下个脚本就行了
视频上传油管,生成字幕,下载,完事儿。
LZ 这个需求真的可以,不过只靠插件不行。
具体 ls 也说了,就是 2 步,上传油管,下载字幕(有只下载字幕的网站)。
提取了正确的文字也没用把,人家教程就是图文合一的
浏览器插件过分了,能读取到 stream 并解析,这和之前 v2 大火的那位提供免广告观看视频有异曲同工之妙。而且语音识别这种工作量你让一个插件跑? 5 分钟的视频让 js 跑个 10 分钟可能还在跑,既侵权+做的事又没意义,楼主就是典型的眼高手低,指点江山。
那种可以用文字简单直接说明白的信息,如果是以视频的形式提供我基本不会看,特别是通勤的时候,听旁白还要找耳机。
视频作为一种媒体形式是可以承载文字难以承载的内容的,比如动画演示和实验实拍,这种得自己能看懂视频的 AI 才能转换成文字描述。
所以现阶段能实现的就是把音频进行语音识别,不过考虑到我关注的视频号都是能充分发挥视频媒体特性的,估计这种功能对我来说没啥用。
方案一:autosub 可以看下。我用过,识别率有点低。
方案二:ffmpeg 转音频后找在线转换的,例如百度,讯飞。网易。我之前用过网易的见外免费的,https://jianwai.youdao.com/index/0
推荐飞书妙记,好用到哭 https://www.feishu.cn/hc/zh-CN/articles/360049067963
无非就是语音识别出字幕,只不过不需要时间轴,建议发起幻想,成本不低,所以没人做。
认同 3 楼的这个观点:“而且我认为不如直接找文本教程,视频教程质量中位数和平均值均较低”。
Youtube 本身就能做到提取整个视频的全部字幕(语音识别),但即使能做到,也达不到楼主的目的。首先,语音识别成文字,肯定存在一定的错误率,尤其是专业词汇,影响理解。第二,大部分视频教程,是语音配合画面的动作来解释的,你单纯看字幕,是无法获取到作者的意思的。
哟,又有产品来逛 v2 了
视频里面的音频只是做辅助用的,转成文字也没有用。
并不是,有字幕我直接提取字幕就行,有很多视频是没有字幕的。
看介绍这个似乎真的可以,试用一下,多谢。
另外,不明白这种冷嘲热讽,不行你上的风气那里来的,我只是因为一个比较小众的需求来找找现成市场有没有解决方案,这里不讨论深度的东西,就打字嘲讽很有意思?
你知道有个词叫 api 嘛?又不是让 js 插件自己去做语音识别。另外可能我标题里只有插件一个词,你就没看看正文里还有“或工具”这个选项?
视频流你可以理解为被分割成只包含几 s 缓冲小段小段的视频文件,一般视频网站的下载工具就是下载再格式转换成 mp4 。
我用 autosub 加讯飞接口做字幕都想吐,人工校对也有不少工作量
这个解决方法和自动添加字幕是一个原理,可以参考这个
https://github.com/wxbool/video-srt-windows
你的视频必须有如下特征
普通话标准
专业术语易于识别
全程语音占的比重大,如果某些台词就是“如下图所示”请问你怎么转
更重要的是,你本来可以直接找一篇相同主题的文章去看的,请给我个理由非要用这个视频转一遍
哦对了,还有中英文混杂、英文简称(伪简称)、校对等工作来做
chrome 在播放声音的时候,右上角的插件栏会有一个像是播放列表的图标,点开之后会有个实时字幕的选项,开启选项后,会出现一个黑色底的窗口,实时的将音频中的话识并展示别出来。
写个抓取 youtube 字幕的插件就可以
你真的挺搞笑的,标题写着插件,然后正文加工具,我就针对你说的标题一部分做回答有问题吗?你说要 A 方案和 B 方案,我回答说 A 方案就是秀逗,有什么问题呢?说难听点,这种插件想法提问就是没过脑子的,伸手党是有当多习惯? B 了
我以为,视频的意义在于某些 不愿意 /不方便看书 或 某些文字不易描述 的场景
这把视频再转成文字,反而又损失一部分信息,那干嘛不直接看书呢?
你自己是秀逗还来展示自己的秀逗?这个需求上面也有很多人说,本身就是可以通过插件实现的,只是你自己夸大它的技术难度。又不是让插件自己来完成所有的工作,插件只是整合不同 api 提供的能力。
并不是,很多网课资源,本身是没有文字的,网课的课程转成文字,配上课件,损失的信息量其实并不多。
很简单的需求,斯坦福的网课,麻烦你找一个相同主题的文字内容给我?
分割成一段一段也不是文本。
我觉得可行的办法是先给视频配上字幕,然后根据字幕一帧一帧转成图片,然后再把图片呈现的信息和字幕描述成一段文字,自然就成了文本。视频>>逆向成>>小说
因为这里是程序员的社区,程序员的风气就是你行你上。
https://www.videoindexer.ai/
微软有这个服务,不过得自己上传视频
可以看我传的这个感受一下
https://www.videoindexer.ai/accounts/7f8a628c-25b6-4367-8f68-fea3d86872c5/videos/1d6b552ef2
[![2gwySH.png]( https://z3.ax1x.com/2021/06/10/2gwySH.png)]( https://imgtu.com/i/2gwySH)
可以自动根据画面分割,然后配文字描述
可以,最近在做一个给视频实时添加智能字幕的插件,和你这个需求差不多
Chrome 桌面版的“多媒体控制”在测试实时字幕,不过只支持英文
感谢感谢,这个确实好用。。
试了一下,中英文混合的效果都很不错。
https://meetings.feishu.cn/minutes/obcndo7y9iyk1m1u34o47f7e
你行你上的意思是在指责别人不行的时候,自己要知道怎么可行。而不是在这全世界各种解决方案都已经有的时候,在这里就凭自己井底的思想局限认为自己做不到,别人一定做不到。