收录于话题
【编者按】当前,人工智能正以前所未有的速度和规模引领新一轮科技革命和产业变革,激发全球科技之变、产业之变、时代之变。
周崧弢拥有25年广告业从业经验,19年互联网广告产品研究和技术开发经验。担任多个协会的互联网专家组成员,多部互联网广告国标、团标制定参与者,上海广告研究院兼职研究员。
在1956年的达特茅斯会议上,首次提出了人工智能的概念。之后,人工智能的技术发展大致经历了三个阶段:早期以图灵机和图灵测试为代表;第二阶段是1990年代后,微软在语音识别技术上实现突破;第三阶段始于21世纪10年代中期,生成式对抗网络、GPU算力卡等技术的出现推动了人工智能的爆发。
从机器学习到通用人工智能,深度学习技术起到了关键作用。这条技术路线主要包含三大核心技术要点:自然语言处理技术、计算机视觉处理技术和语音处理技术。这些技术要点对于理解生成式人工智能为何能取得突破性发展,以及为何在使用中存在一系列问题和挑战至关重要。
过去四五十年,人工智能经历了显著的发展。在最新的人工智能技术中,有几个核心技术至关重要。首先是独热编码技术,它将人类知识转化为数字信号,供机器处理,是所有机器学习和深度学习的基础。其次是词嵌入技术,它用低维向量表示高维物体或潜在物体之间的关系,使机器能理解语言并进行数学化处理。第三个核心技术是图像分类,它让计算机拥有视觉能力,能识别和生成图像。此外,语义分割和实例分割技术也非常重要,它们使计算机能理解图像内容并指导生成所需内容。这些技术构成了人工智能领域最核心的基础算法,并在不断发展中。
从技术角度来看,生成式人工智能自2022年下半年开始流行并呈现爆发式增长,其背后主要有两大核心技术做支撑。在文字领域,Transformer模型带来了革命性的变化,这一模型起源于2017年谷歌人工智能实验室发表的一篇论文。此后,多家公司基于该模型开发了各自的大语言模型,形成了当前大语言模型百花齐放、千模竞争的局面。Transformer模型中的注意力机制(attention)是其核心,它模拟了人类的阅读习惯和大脑处理文字信息的方式。
在图像领域,最核心的模型是Diffusion,它借鉴了热力学概念,通过像素的随机打散与再合成,使模型能学习和记忆图像的像素组合和结构。自2020年由加州伯克利团队提出后,Diffusion模型已推动图像生成领域的发展,并推出了多个有影响力的新模型,数字内容创作和广告设计带来了革命性变化。然而,Diffusion模型在处理如广告logo和产品画像等具体任务时,由于生成的图像具有一定的随机性和不确定性,仍存在精确度方面的局限性。
自2024年开始,AIGC技术栈的主要开发路径包括视频领域、多模态领域、处理模型犯罪(主要是指与模型生成内容相关的各种违法、违规或不良行为)与纠正AI幻觉(主要指的是人工智能模型生成的不真实、虚构或错误内容),以及对模型的精确控制。其中,在幻觉处理和精确控制方面,截至2024年7月已取得突破性进展。此外,算力优化、推理能力扩展,以及数据安全和数据隔离也是当前AIGC技术领域蓬勃发展和高速迭代的重要方向。值得注意的是,尽管技术不断进步,但在数据安全和隔离方面仍存在一定的风险。
就目前而言,广告行业对于AIGC应用,可以划分为几个关键层次来理解和推进。首先,在基础架构层(L0),应主要依赖战略合作伙伴来解决算力、模型通用数据等核心问题,搭建起广告业与底层基础设施服务者之间的战略合作桥梁。
在数字营销行业的任务模型层(L1),AIGC在互联网广告和数字营销这两个已经高度数字化的领域内可以大有所为。在这一层有四个关键点:一是需要有专业的评价和大模型的接入机制。二是需要建设和完善行业的知识图谱。三是虽然行业专家和积极强化学习及应用还为时过早,但需要加强重视程度。四是合规审查工具和服务也是这一层不可或缺的一部分,必须确保AIGC在广告业的应用符合相关法律法规和社会的公序良俗。
在这些方面,商广协作为行业协会可以组织大模型厂商和大型用户,如广告主和广告公司,共同建立一系列测评标准,对适用于广告业的大模型进行横向比较和测评。这将帮助那些技术能力和资源有限的广告公司快速选择适合的模型,进行AI机器化的改造,从而加速整个广告行业在AIGC化转型的进程。同时,行业协会还可以站在更高的角度,组织行业成员部分公开或共享知识图谱或知识库,加快整个行业数字化底层数据的建设。这将为全行业提供宝贵的行业知识和经验,进一步推动数字营销行业的发展。
AIGC在广告业的应用中,有三个核心点和优势需要不断加强。首先,在算法层面,对于大多数广告公司和普通广告主而言,关键在于如何控制和使用模型,特别是低阶模型、嵌入技术以及增强索引等IT技术。这些技术对于AIGC的应用至关重要,各家公司可以根据自身情况发挥各自的优势。
其次,数据是另一个核心点。数据包括通识数据、时效数据、专业数据和私有化数据。通识数据是基础知识,时效数据则是指那些最新的新闻或事件,需要嵌入到旧的大模型中。专业数据则是各公司在特定领域,如汽车或电子商务领域,与客户共建和合作积累的数据。私有化数据则涉及到数据的确权和数据资产问题,需要保护广告主、代理商和媒体的利益。
最后,算力也是一个重要的考虑因素。虽然中国的广告公司在算力上受到一些西方国家的“卡脖子”限制,但好消息是国产芯片正在追赶。此外,在算力的使用上,大部分广告公司和广告主的需求主要集中在推理环节,而非训练环节。
在控制AIGC模型方面,目前已知有7类主要手段,分别是提示词工程(Prompt)、增强检索生成(RAG)、低阶模型(LoRA)、知识库嵌入(Embedding)、精调和指引(Fine-turn & Instruct)、基于广告受众反馈的强化学习(RLHF)和大模型预训练(Pre-Train)。这七个主要路径构成了目前控制AIGC模型的主要手段,它们在算力成本、数据成本、学习成本、效果和时间上各有优势,不同的公司在选择时应根据自身情况和资源进行权衡。
对于广告公司或广告从业人员而言,掌握良好的提示词工程(Prompt)的相关技术是一个低成本且高效的选择,能够显著提升产出效率。因此,学好提示词工程被视为降低控制和使用模型成本的最佳路径。如果公司拥有足够的资金、技术数据和算力,终极的控制方法就是进行大模型预训练(Pre-Train)。然而,这一方法目前在国内甚至全球也只有几家大模型厂商能够负担得起,对于大多数广告公司来说,只能作为了解的内容。
AIGC在广告创意领域的应用十分广泛。首先,在文案创作方面,AIGC不仅能够撰写简单的文案,还能应对各种复杂、有格式要求或特定意图的文案创作。关键在于如何对模型进行推理提示和知识库嵌入,使其能够学习和生成符合需求的文案。目前,许多公司已经开始采用AIGC辅助文案创作,通过精调和优化模型,输出的文案质量远超仅使用通用模型生成的内容。
其次,AIGC可以嵌入到广告业务流程中,尤其在工作流程编排方面表现出色。例如,在投放和管理广告账户时,AIGC能够精确地指导每一步操作,并在遇到特定条件时做出相应调整。这使得广告公司开始对其程序化购买工具进行AI机器化改造,以提高工作效率和投放效果。实际测试数据显示,经过AIGC改造的工具在效率、点击率和成本控制等方面均表现出显著提升。
此外,AIGC在图像图形设计方面也带来了显著变化。通过精调模型,AIGC提供了多种功能,帮助设计师在信息流广告和广告提案概念稿阶段提升工作效率和创作质量。
可以看出,从文案创作、图像创作到程序化广告的业务管理,AIGC已经具备了相当稳定的生产能力。然而,在视频领域,由于特定原因,目前还未找到最优的商业化解决方案。
在广告业中,为了提高对AIGC模型的控制能力,员工可以掌握一些关键的技巧。这些技巧主要源于实战经验的总结,首先就是文字推理。在执行任务时,给模型下达的指令需要明确、具体,就像广告主给广告公司下达工作简报一样。一个高质量的推理过程需要有一个明确的结构,包括角色扮演、明确指令和提供上下文。通过提供详细的提示词,可以得到比简单要求更好的效果。
进阶的技巧是COT(Chain of Thought思维链模式)。COT模式主要包括任务拆解、推理和协同,以及引导用户进行问答。这一模式要求用户在执行任务前,首先列出步骤,比如先做什么、后做什么,再做什么。这种思路告诉模型后,模型做出来的东西就更像一个专业人士输出的结果。
此外,对于专业广告公司来说,拥有基于调过的专门模型库可以大幅度提升输出广告作品的效率。这些专业的视觉元素被实语义分割后嵌入到通用模型中,使得精调过的模型的出图效率远高于通用模型。
最后,当AI大面积加入到广告系统中时,会有一个广告数据的存证和追溯的问题。为了解决这一问题,可以采用基于链的图片或文字块唯一识别和追溯方案,并且要严格遵守网信办等七个部门联合发布的《生成式人工智能服务管理暂行办法》中的相关规定。同时,对于素材的版权和使用权问题,也在不断探索和完善中。
AIGC正在加速进入广告行业。然而,广告行业也面临着AIGC人才储备不足等诸多挑战。
首先要做的是对现有专业领域人才的知识和技能升级。现有的专业领域人才绝大多数仍然习惯于采用传统的工作模式,因此其知识和技能需要与AIGC技术相适应,但这两者之间存在着明显的鸿沟。这个鸿沟的存在,无疑给AIGC技术在广告业的推广带来了一定的阻力
为了弥补这一鸿沟,不同的公司采取了不同的策略。一些公司选择将学习、掌握及应用AIGC考试作为升职加薪的依据,这种做法虽然立竿见影,能够迅速推动员工学习AIGC技术,但也可能削弱员工的主观能动性,导致他们只是为了考试而学习,缺乏真正的兴趣和动力。相比之下,另一些公司则更注重培养员工对AIGC技术的兴趣和自主使用意愿。他们通过举办各种活动和案例分享,让员工亲身体验AIGC技术的魅力,并配备相应的工具让他们在实践中学习和成长。虽然这种方法的速度相对较慢,但它能够更全面地提升员工的能力,并激发他们对新技术的热情和创造力
然而,无论采取哪种策略,都需要关注员工的主观能动性和自主意愿。尽管AIGC的普及是一个不可逆转的趋势,但传统的手工作品也可能因此变得稀缺和更有价值。因此,员工是否有意愿使用AI技术,是否愿意将自己的工作流AIGC化,都是需要考虑的重要因素
对于广告公司来说,掌握推理技术、控制和精调技术、标注技术这三项关键技术的员工,可以被认为具备了AIGC化的能力。而能够将工作流程进行AIGC化的抽象和优化,将其转化为AI能理解的工作流并加入到AI模型中的人才,更是公司中的核心AI人才。他们不仅能够提升自己的工作效率,还能带动整个部门和部门之间的工作效率提升
最后,公司还需要关注那些具有变革潜力的人才。他们有可能改变未来广告公司的生产关系。这类人才具有独特的视角和创新的思维,能够引领广告行业走向新的发展方向。因此,对于这类人才,我们需要给予更多的关注和支持,鼓励他们发挥自己的创造力和想象力,为广告行业带来更多的创新和变革
其次是要加强面向未来的人才储备和培养。在人工智能化时代,跨学科知识体系对于广告行业人才至关重要。例如,就广告设计而言,能够熟练掌握广告设计原理、AIGC技术和艺术类三个学科知识的人才,将更具竞争力。同时,当前市场营销、广告设计等专业的大学缺乏人工智能方面的教材和训练工具,而拥有这些资源的主要是顶尖院校的计算机专业。这种不匹配状况导致人才储备和培养面临挑战。也只有当新闻传播或广告专业拥有这些教材和训练工具时,未来的人才储备和培养才能真正建立起来。
此外,还需要注意协调好AIGC提升效率与新人发展机会之间的矛盾。AIGC能够提升效率,替代大量基础工作,但这也可能导致新人无法通过实践这些基础工作而获得对于广告作业的深入理解、全面掌握。这是一个需要行业共同思考并解决的问题。
在讲座的最后,周崧弢还回答了会员关心的问题。
针对传统广告设计人员如何适应AIGC在广告制作方面的变化。周崧弢认为,有条件的公司可以直接采购现有的生成式人工智能工具,这些工具大致分为三类,其中一类是专业模型,需要深入阅读相关论文和操作指南才能掌握。虽然学习门槛较高,但学成后的设计师将非常抢手。其次,对于大部分设计师而言,重要的是理解原理并保持丰富的想象力,然后通过不断尝试来掌握使用技巧。由于现在模型的运行成本非常低,设计师可以大量练习,通过试错来熟悉提示词的规则和技巧。只要设计师愿意练习并掌握提示词技巧,在较短时间内z内就能显著提升设计能力。
针对广告公司在架构调整上如何适应Agent(智能体)对广告行业的改变。周崧弢认为,Agent正在深刻改变着一些广告公司的工作流程和习惯。例如,将程序化购买的账户托管、文案创作以及短视频脚本的分析和改写等环节。不过,传统的广告公司架构在短期内可能不会有太大变化,各部门如创意部、媒介部、策划部、客户部和财务部等仍然保留。但Agent技术可以作为一个新的工种融入现有架构中,这一变化预计在不久的将来就会实现。
针对AIGC时代下广告人如何体现其无可替代的重要价值。周崧弢认为,在AIGC时代下,广告人体现其无可替代的重要价值的方式主要体现在两方面。首先,是广告人的创造性。现有的AIGC模型虽然能够对知识进行排列组合,但其知识边界仍受限于全人类的已知知识,缺乏真正的创造性。而广告人的创造性是独一无二的,能够创造出全新的、超越现有知识边界的内容,这是AI目前无法替代的。其次,是广告人的自主意识。AI需要人类下达指令才能进行推理和行动,缺乏自主意识。而广告人能够根据自己的主观意愿和判断,自主地进行创意和策划,这是广告人在AIGC时代下另一个重要的无可替代的价值。
针对人工智能应用存在的风险。周崧弢认为,现阶段来看,人工智能应用存在的风险主要包括两大方面。首先是数据隔离和数据确权问题,由于全球各国在AI训练阶段使用的数据以及生成作品的权利问题上缺乏明确的法律法规,导致大量风险和纠纷,需要顶层法律法规或判例的支持。其次是违法问题,尤其是在内容生成方面,如何确保不违背社会的公序良俗和广告法规是一个挑战。由于机器可能无法完整捕捉到所有监管条例,存在触犯风险。因此,有必要将违法广告或各种广告的管理条例做成知识库,嵌入到内容生产过程中去,以规避这一风险。