2023《大语言模型 LLM 技术报告》(附下载)

浏览:172次阅读
没有评论

共计 1806 个字符,预计需要花费 5 分钟才能阅读完成。

报告摘要

《2023 LLM 技术报告》现已与《2023 中国开源开发者报告》共同发布,此报告整体围绕 LLM Tech Map 梳理逻辑来展开。从基础设施、大模型、Agent、AI 编程、工具和平台,以及算力几个方面,为开发者整理了当前 LLM 中最为热门和硬核的技术领域以及相关的软件产品和开源项目。

毫无疑问,开源开发者圈子来看,2023 年是大模型 LLM 年、生成式 AI GenAI 年。

这自然要从 OpenAI 说起,前一年年底,ChatGPT 的横空出世,标志着 对话式 LLM 开始进入公众视野,为人们提供了全新的人机交互方式。而 2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新的台阶,为 LLM 的广泛应用奠定了基础。再之后的 11 月份,OpenAI 再发力,GPTs 的到来,“用户自定义 ChatGPT”的能力,更是让世人领略了 OpenAI 作为 LLM 一哥的宏大叙事能力与强劲技术实力。

New Bing(Bing AI)代表了微软在 LLM 领域的野心和决心,它首次把当时世人能想到最有价值又可行的 LLM 应用场景——“智能对话 + 联网搜索”——无缝整合了起来,大有干掉搜索行业和问答社区的趋势,而后事实证明,全球最强 IT 问答社区 Stack OverFlow 深受其害。Google 紧随其后推出 Bard,作为其首次亮相的对话 LLM 产品,无疑具有其里程碑意义,尽管它的首秀并不尽如人意,车翻了又翻。

Claude 2、PaLM 2、Llama 等模型与产品也展现了 LLM 在语言理解和多模态处理能力方面的探索,甚至 Claude 2 还一度被誉为实力可以硬刚 ChatGPT。而 Meta 开源的 Llama 2 更 成为了 LLM 领域开源势力的典型代表 ,它的出现,犹如一颗投入平静湖面的石子,激荡起层层水波,“Llama 2 一开源,全球范围内进入了 百模混战 阶段”,这个说法一点也不为过。年底的“虚假宣传”Gemini 与“磁力链开源”Mistral 8x7B 两大神作,也凭借不输 GPT-4 的实力,将 LLM 狂潮卷到天际。

Stable Diffusion 和 Midjourney 这两大图像生成系统的出现,极大地拓展和加速了 LLM 在计算机视觉领域的应用,它们突破了传统图像生成方式的局限,仅需要用户提供文字描述,就可以生成高质量的数字艺术作品。它们的图像生成质量、样式多样性和用户便捷性都是极大的突破。这为广大的个人用户和创意行业提供了强有力的工具,彻底改变了数字艺术内容的创作方式。同时,它们也引发了人工智能在创作领域的伦理和法律讨论。LLM 杀进 多媒体领域。往后 DALL-E 3 模型升级、Adobe 产品整合 LLM 能力、语音模型 whisper-3 更新、AI 虚拟主播创造等,都是在这条路上的进一步发展。

AI 编程 方面,Copilot 可以根据开发者的代码提示自动补全代码,大大提高了开发效率。这也引发了代码原创性的讨论,但它已经实实在在将 LLM 拉进了编程应用领域。

LangChain 的出现,实现了 LLM 之间的链式交互,使多个 LLM 模型串联工作,发挥各自的优势,并且可以将 LLM 模型与外部数据源进行连接,产生更强大的语言理解和生成效果。这开启了 LLM 集成应用的新方向,并诞生了一个新的细分领域 “LLMOps”

“提示词工程”,这是 LLM 直接催生出来的新“学科”,它的核心在于研究人类如何与 LLM 更好地进行“沟通”,找到让 LLM 能够准确理解人类意图的方法。提示词工程探索如何以 LLM 可以解析的方式来表达需要它完成的任务,寻找 LLM 的“最佳输入形式”。通过注入提示词,提示词工程建立了一套“人机交互语法”,来更精准地向 LLM 传达想要它生成何种输出的指令。这为人们与 LLM 之间建立高效、准确的“沟通桥梁”提供了可能性。什么“链式思考(CoT)”、“自动推理并使用工具(ART)”、“思维树(ToT)”……甚至运用心理学对 LLM 进行“情绪提示(EmotionPrompt)”,提示词工程俨然在将 LLM 一点一点解剖,试图让人类成为可以将其掌控的“咒术师”。

报告预览

相关文件下载地址
© 下载资源版权归作者所有;本站所有资源均来源于网络,仅供学习使用,请支持正版!
正文完
关注微信公众号,获取更多优质资源!
post-qrcode
 
BT
版权声明:本站原创文章,由 BT 2023-12-31发表,共计1806字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)
验证码