Google的AI笔记应用工具NotebookLM最近更新,支持输出中文的音频内容(Audio Overview)了(50+anguage),我用最近看的《叫魂:1768年中国妖术大恐慌》一书试用了下,效果很惊艳!
先上效果:
叫魂,1768年中国妖术大恐慌.Soulstealers,The Chinese Sorcery Scare.(美)孔飞力著.陈兼,刘昶译.孔飞力著作集.2014.上海三联书店.pdf
说惊艳在于音频的效果很逼真,跟真人没什么区别,有语气词,停顿,思考的间隙,模拟的两人对话效果等等。如此应用起来,大规模用于生产环境,传统真人版的播客几乎就会完全被取代了。
NotebookLM官网:https://notebooklm.google.com
首先上传你的书籍,目前支持PDF, .txt, Markdown, Audio (e.g. mp3)等格式资料。
上传完以后,就可以生成Audio Overview(需要稍等片刻)。我试了几本书,生成的Audio Overview的时长大约7分钟左右,以两人对话的方式呈现,音频质量非常逼真,跟央视的对话,访谈节目可以比一比。当然除了Audio Overview,常规的timeline,study guide,briefing,ming map以及一般AI的问答模式,NotebookLM应有尽有。
效果惊艳,可玩性,想象空间就很多了。比如,打通微信读书之类的阅读平台,批量生成Audio Overview,然后供喜欢读书,喜欢听书的人使用,愿意付费订阅的应该大有人在(效果,体验比目前常规的文字转音频要好得多),大有前途。
一时很激动,多试了几本最近手边的pdf书,分享在此:
跨越边界的社区.北京浙江村的生活史.项飙.2018.生活·读书·新知三联书店.pdf
Audio Overview
万历十五年.黄仁宇.2008年读书·生活·新知三联书店.pdf
Audio Overview
评论
多谢大佬分享
这效果和真人一样,厉害了!
真的逼真,直接放了来可能猜不到是AI所为
真不错,用起来
如果把自己的音色上传分析,直接就取代播客了。收银机电台可以无人化了配合ai。
这个厉害了,如果不说的话都不知道是Ai在说。不过喜马拉雅等音频有很多是在讲解,而不是在读书,目前看Ai似乎还替代不了这部分。如果哪天真的Ai连讲解的活都能做了,那我就不用再读书了,需要什么知识直接问它就行。
这个恰恰是在讲解。总结你自己上传的书籍资料。
所以,如果求阅读的广度,现在完全可以了。一天看(听)个几十本书,很容易做到了。而且还不是泛泛的,总结讲解得很到位。求深度,细节可能差了些。
如果能根据自己的笔记思路梳理出书中的主线,并且能就划线或批注点做出讲解,包括必要的背景知识、横向和纵向拓展、及对争议点做出多种解读,那确实可以代替人工讲解了。读你文章,我还以为对话式的内容都是由你的笔记生成的,而不是AI自动拓展的。
哈哈,全自动的,没有任何人工干预。当然,输入一些提示词,加入一些人工干预也可以的。
刚去体验了下,网页全中文界面很友好,但要科学,一点点不方便。
可惜我不听播客,最近准备有空读一下叫魂
这么牛逼。。。
这玩意太恐怖了
效果不错啊