冒泡网:AI智能体|扣子(Coze)搭建【假如书籍会说话】工作流

2025年6月8日10:49:36冒泡网:AI智能体|扣子(Coze)搭建【假如书籍会说话】工作流已关闭评论 103 次浏览

好久不见,又又又拖更了,最近当牛做马,活太多了,整的我都想换家公司上班了,或者辞职 all in AI 去了。

其实关于《假如书籍会说话》这个工作流,我们很早很早之前就做出了。

但当时觉得讲起来篇幅比较长,因此就没打算拿出来讲。

因为篇幅一长,不仅影响完读率,而且还影响兄弟姐妹们实操,容易搞得很乱,很多人会顶不住。

这也是为啥有些工作流稍微复杂点,有些兄弟姐妹们就让我出视频教学,近期真出不了,时间成本太大了,近期经济压力也大。

如果经常看我文章的兄弟,应该知道,我没接过广子,智能体也很少变现(我也是要吃饭的呀)。

因为多数加我的人,都是在白嫖我给他答疑,这个工作流卡点了,指导一下,哪个工作流卡点了,指导一下。

再加上有工作,所以我回复就变慢了,有些时候,真不是不给干货或者说不答疑,就是太忙了,因此这也导致得罪了某些白嫖哥。

就比如以下这位兄弟,我稍微回晚了一点,直接给我删了。

我发现这种还蛮多,只要我稍微回复晚一点,就开始情绪化了,成年人情绪这么不稳定的嘛。

所以兄弟们,请谅解一下,不是故意不鸟你,不能总站在自己的既得利益的立场,为自己的利益所考虑,也需要考虑一下他人所处的环境,将心比心。

好了,回到今天的工作流。

其实对于读书这个事情,我们都能听到不管男女老少,都会对我说这样一类话,好好读书,好好学习.....

读书是成本非常低,且收益非常高的事情。

为什么这么说呢?

因为有些经典书籍,几十年了,还这么受欢迎,证明它是被大众认可的,可能里面的知识的确是正确的。

那你想过没有,写这本书的人,是把他毕生的经验,心得都浓缩在了这本书里面。

为了获得书籍中他们写的这些知识,他们踩过无数的坑,才明白其中的道理。

而这些道理/知识,你只需要一周,一个月,一年读透这本书,你就能掌握。

简单来说就是别人花了一辈子才积累出的精华知识,你只需要花一段时间读透这本书就能掌握十之七八了。

所以,这就是读书的好处,读书就好像有大佬在上面带着你,告诉你哪里有坑,哪里怎么做,比你自己研究,自己踩坑,真的快太多了。

但我们也不能只做一个只学不做的人,这样就和没学差不了多少。

我有个朋友就是,看了几遍写作课,但是到现在还没开始写,那这不就和没学一样了吗?

好了,吹完牛皮了,我们看看今天的工作流效果如何。

需求分析

大多数问我这个工作流的人,都不是为了真正的想学知识,或者了解一本书里面的内容啥的。

其实就是看有人通过这种内容,获得了结果,赚到了米。

所以他们也想通过这种方式去分一杯羹,但碍于自己懒得做这种视频,或者做起来很麻烦,想通过工作流这种方式来一键生成。

说白了就是懒得动手/不懂出手,但是想获得结果/米,又不想太浪费时间。

所以存在这么一个需求,因此这个工作流就有它的价值。

但你能不能拿到结果,那就看你如何操作了,祝你好运。

工作流流程分析

整体事件(开场白阶段)的工作流流程如下。

整体的 Coze 流程如下。

开场白阶段。

主持人与书籍对话阶段。

保姆级工作流教程(开场白阶段)

本篇文章,我们只讲开场白的工作流阶段,因为主持人和书籍的阶段实在太太太太太太太太长了。

全篇写下来,我估计大家没耐心看完,同时实操也会因为复杂而导致挫败感。

所以,我只讲开场白的阶段,后续的阶段,看情况更不更新,工作流会上传共享空间,群里的小伙伴可查看,不懂群里问即可。

第一步,开始节点

开始节点设置几个参数,start,book_name,video,logo,host,book。

它们分别对应的意思是开场白阶段时间的记录,书名,开场白视频,视频logo,主持人图片,书籍图片。

第二步,大模型

这个节点的作用,就是根据提示词生成书名的背景图片。

这里我们设置一个参数 input ,数据来源于开始节点的 book_name ,模型选择通义千问 Max 。

由于篇幅的问题,这里的话,我就不展示系统提示词和用户提示词了,不然整篇文章就会非常长,如果需要找我就行。

第三步,图像生成

这一步我们根据提示词,生成相应书籍背景图片,模型选择通用 pro ,比例 16:9 ,质量直接拉满,输入参数设置为 output ,数据来源为上一大模型节点的 output 。

第四步,选择器

选择器节点来判断图像是否生成图片。

如果上一节点生成图片,则跳转变量聚合节点。

如果上一节点没生成图片,则优化提示词,重新再生成。

第五步,提示词优化

添加提示词优化这一步的原因是担心提示词有问题,无法生成相应的图像,通过优化提示词,再次生成图像提示词。

第六步,图像生成

根据优化后的图像提示词,再次生成图像。

第七步,变量聚合

变量聚合这个节点的作用,主要是找到那条路径成功生成了图片,并将其作为输出。

第八步,语音合成

这个节点的作用就是生成开场白念书名的那段音频。

第九步,视频合成

这个节点的作用是获取开场白阶段音频时长,数据来源为语音合成节点的 link 。

第十步,视频合成

这个节点的作用是创建草稿箱,为后面将生成的内容放入草稿中做准备,作品的尺寸大小,根据个人情况设定。

第十一步,代码

这一步的作用是数据转化,后面的插件无法直接输入数据,用代码节点实现可插入数据的功能。

主要设置几个变量名:audio_url,video_url,text,width,height,time,start。

第十二步,视频合成

这个节点的作用就是把音频导入进去,为合成视频做准备。

第十三步,视频合成

这个节点的作用就是把视频导入进去,为合成完整的视频做准备。

第十四步,视频合成

这个节点的作用是生成视频的字幕。

第十五步,代码

这个代码节点的作用也是数据转化,和上面说的哪个大同小异。

这里需要使用开始节点中的 start ,表示已经过了视频的开头小阶段了,该到视频的下一个阶段了。

第十六步,视频合成

这个节点的作用是把“叮”的这个音频导入视频当中。

第十七步,变量赋值

这个节点的作用是记录时间,因为开场白阶段已经完成了,我们需要记录开场白在什么时间完成的,才能跳到下一个主持人于书籍说话的阶段。

第十八步,大模型,循环

后面这里是关于主持人与书籍对话视频的阶段,这篇文章就先步讲了,不然就很长了,有机会下篇再讲。

第十九步,结束

生成视频后,我们需要获得草稿箱的链接,打开链接,就能获得视频了。

总结

整体的步骤非常的复杂,细节非常的多,如果是纯小白,或者刚接触没多久的新手,单单理解这个流程就需要花费很多的时间。

这也是为啥我不拿出来讲的原因,因为我觉得不是视频讲,我估计都很难讲明白这个事情。

我希望我的文章即使你没法实现工作流,也能学到一点工作流的流程逻辑。

文章中相应的代码,和提示词,如果有需要的话,可以找我。

本期的内容就到这里了,感谢你的耐心。

  • 冒泡QQ群
  • weinxin
  • 我的微信
  • weinxin