两天搓出动漫助手,AI原生时代的开发者太卷了

原标题:两天搓出动漫助手,AI原生时代的开发者太卷了

在12月20日举行的2023百度云智大会·智算大会上,百度智能云“千帆大模型平台应用开发挑战赛”圆满收官。经过3个月的脑洞大开之旅,数百支参赛团队里逐出了9个最优秀的项目,他们在比赛中尽显非凡的奇思妙想与技术实力。

大模型时代,每一个好想法都有了更快落地的可能性。我们采访了部分获奖的开发者团队/个人,深入聊聊一款AI原生应用背后的诞生故事,揭秘那些脑中乍现的“灵光”是怎么通过百度智能云千帆大模型平台变成现实的。

大模型,

为职校生创造另一种可能

课通天下副总裁徐生吉创业之前曾在职业院校当过8年老师。2016年,离开教职2年后的徐生吉发现了在线教育行业蕴含的新机会,在朋友的邀请下,一起创办了这家数字化教育培训公司。课通天下主要为技工院校、职培学校、企业等提供职业培训课程和搭建技能培训云平台,用户画像中有不少蓝领人群。

在教培行业摸爬滚打十余年,徐生吉对老师和学生这两大主要角色的痛点感同身受。老师备课、录课、评卷、辅导的过程复杂又耗时;学生更希望老师根据个人情况制定学习计划,并设置阶段性的测评和陪练,但要“千人千面”并不现实。

“教培通常是每一轮技术革命最后一个影响到的行业。因为这个行业要求稳定,对产出质量要求高,且细分领域狭窄,很难有一个技术进来后能让它产生颠覆性的改变。”徐生吉说。但当大模型爆发后,徐生吉很快意识到,大模型是少有的一种能给教培行业带来颠覆性变革的技术,可以从底层直击低效环节,让老师和学生都能提高效率。

于是,课通天下基于自身在教培场景的数据积累,通过使用百度智能云千帆大模型平台上的文心大模型(ERNIE-Bot)、Embedding-V1模型开发出了一套职业培训与人才发展的AI工具集「猴动力」,包括针对职业技能评价场景帮助老师提高培训工作效率的“讲师通”、“出题通”,“评卷通”,能生成工学一体化教案的“工学通”,根据学生岗位信息生成技能图谱和针对性教材的“技能通”等,目前“出题通”、“讲师通”、“技能通”已上线,其余产品在今年内上线。

“与我们以前做培训云平台或者培训工具的开发相比,节奏更快了”,徐吉生介绍:“「猴动力」一般一个工具开发周期在2周左右。得益于百度智能云千帆大模型平台提供的很多底层技术与工具链,开发大模型应用的难度大大降低了,我们可以随时调用模型和插件,快速开发出AI应用。”

最让徐生吉最期待地是,「猴动力」上线后,能够真正帮助到老师和学生。以工学领域为例,很多技工学校的老师是从车间里出来的,他们实操性强但缺乏理论深度,对他们来说,写教案很难但又必须要写。有了“工学通”,几分钟就能生成工学教案,技工院校的老师简单修改后即可使用,至少能帮助节省百分之三四十的工作量。

对于学生来说,借助AI教培工具不只是提升效率。技工院校的很多学员来自前沿教育资源相对缺乏的农村,而经过职业技能培训,拿到一份职业技能资格证书,意味着他们找到工作的概率大大提高。

复旦研究生,

两天开发AI动漫助手

复旦大学计算机视觉专业的的研究生付浪是一个十足的编程爱好者,“我一天在电脑前坐12个小时搞开发也不会觉得累,coding时常常感觉不到时间在流动,编程能让我的想法一步步实现变成功能,这个过程让我很兴奋”。

付浪也是一个百度深度用户,每次百度出了什么新技术新产品,他都会上手“尝鲜”。百度智能云千帆大模型平台出来后,他也很快就试用了,并带着自己落地的新想法 — 「动漫助手」参加了千帆应用开发大赛。

平时,付浪很喜欢看动漫,但有时候查询一部动漫中的情节时,经常要翻阅很多资料再手动提炼信息,这很麻烦。他想用大模型来开发一款推荐问答助手,更便捷地为动漫爱好者推荐感兴趣的动漫作品,解答动漫问题,也能为动漫创作者提供创作灵感。

「动漫助手」包括智能关键词推荐、智能场景配图、AI对话、智能UI四个功能模块。其中,智能对话是核心功能,主要调用百度智能云千帆大模型平台上的文心大模型ERNIE-Bot 4.0实现,并进行了prompt优化和后台引导,支持进行多轮对话。此外,对话过程中,大模型可推荐一句与动漫相关的名言以及根据对话提炼关键词,预测用户接下来想了解的信息并做推荐。智能场景配图让UI更协调、美观,通过千帆平台上的 ERNIE-Bot 4.0和 Stable-Diffusion-XL可基于对话和推荐的关键词,为用户对话中描述的场景配图。实际体验下来,付浪觉得ERNIE-Bot 4.0 在理解、逻辑、感知、推荐等能力上的表现都很不错,可以做到准确理解对话内容,并get到核心意图。

动漫助手项目是付浪第一次真正用大模型来开发应用,这次经历给他带来了与以往的开发方式很不一样的感受。

“以前我做开发,底层模型都是我自己从头训练的,光在大模型训练阶段就要花上好几个月。”付浪说“而这次直接用百度智能云千帆大模型平台上的现有模型,实际开发过程只用两天就完成了,这让我有更多时间来打磨创意”。

“千帆大模型平台提供算力资源训练,对我这种显卡不足的学生用户特别友好,开发成本和ChatGPT相比低了很多,技术文档介绍地非常详细,技术人员一看就懂,可以很快上手开发”。付浪认为,大模型大大简化了传统的应用开发流程,现在只要开发者有需求、有想法,大模型就可以高效且低成本将好想法落地。

来场说走就走的旅行,

Citywalk也可以很智能

在转行产品经理前,蔡国琛是一名Python 算法工程师,他早在六七年前就接触到了AI开发,平时也经常参加AI相关的比赛、活动。自从大模型爆火之后,从热门技术到工具,蔡国琛一直持续关注,他对大模型怎么实现应用落地更感兴趣。

一个偶然的机会,他在社群里看到了“百度智能云千帆大模型平台应用开发挑战赛”的消息,便报了名。

基于千帆大模型平台,蔡国琛花一个月时间开发出了一款城语APP,Slogan是探索城市的故事。谈到设计初衷,蔡国琛表示希望城语能解决他在旅行中遇到的一些痛点:“我旅行时喜欢走小众路线,但我发现目前很多APP没法满足我个性化的需求。它们更倾向于推荐热门景点,导致游客扎堆到少数的网红景点,景点人流量两级分化严重。而且这些APP缺乏对景点文化内涵的充分挖掘,没法帮游客增进对景点的了解和认同”。

城语APP先将场景落地到了蔡国琛工作的上海,旅游方式则聚焦到最近火热的Citywalk上。

城语APP的架构系统分为数据层、模型层、接口层和展示层,核心语言用Python实现。它支持对话交互、地图交互、文本生成三大功能,其中景区介绍功能采用文心大模型 ERNIE-Bot 3.0实现,推荐、生成等功能基于文心大模型 ERNIE-Bot 4.0实现。鉴于当前文旅数据集缺乏,蔡国琛自建了上海历史文化景点相关的数据集。

城语APP的交互逻辑非常简洁,用户选中地图的起点,并输入自己的需求(如“暑假适合带孩子一起体验的景点”),剩下的就交给大模型。

城语APP先是根据用户需求生成不同的Citywalk路线,游客可以从中选择并据此规划最佳路径。大模型同时生成景点背后的历史和文化介绍,ERNIE-Bot 4.0表现出了优秀的泛化能力,生成的景点介绍语言风格丰富,很接近自然语言。

蔡国琛认为,城语APP的最大亮点是将大模型的能力与APP充分融合:包括逻辑推理、总结摘要和文本生成能力。无需人工干预即可从内容到推荐端到端实现旅游规划功能,最大程度降低了人工生成内容的成本,同时提升了用户体验。

回顾这次开发历程,蔡国琛对大模型改变开发范式有了更深的体会。

“AI时代的开发,现在进入到了一个超级个体的时代,人人都能做开发。像百度智能云千帆这样的大模型平台提供了完善的算力底座,也提供了API、SDK等多种开发模式及全套工具链,在使用上也贴合开发者的开发习惯,‘全家桶式’的保障让一个普通的开发者从0-1快速开发应用;即便没有编程能力的用户也可以将自己的想法落地成应用,比如美术爱好者想做文生图应用,就可以用大模型来生成代码,应用前后端组装只需80%的产品加上20%的代码能力就能完成。” 蔡国琛说。

让我们再次恭喜以下获奖的

开发者团队/个人🎉

一等奖:

课通天下·《猴动力》

二等奖:

市场易·《AI文案助手》

城市漫步指南·《城语APP》

格沃智能·《Wow数字助手》

三等奖:

奇融谷·《小奇智询》

亨利教育AI·《财报检析》

海探·《小蓝鲸》

Touch fisher·《动漫助手》

王翊仰 ·《反诈小助手》

返回搜狐,查看更多

责任编辑:

两天搓出动漫助手,AI原生时代的开发者太卷了来源于网络由小明云采集,如果触犯您的利益,请联系站长删除此文链接:https://687267.com/9959.html
THE END
分享
二维码
打赏
< <上一篇
下一篇>>