专业团队|Design Team

当前位置: 主页 » 荣誉资质 » 专业团队

利来娱乐体育平台中文创意写作才智超GPT-4“最会写”的中文大模子Weaver来了NG南宫28官网登录

发布:小编 浏览: function tag_arcclick(aid) { var ajax = new XMLHttpRequest(); ajax.open("get", "/index.php?m=api&c=Ajax&a=arcclick&aid="+aid+"&type=view", true); ajax.setRequestHeader("X-Requested-With","XMLHttpRequest"); ajax.setRequestHeader("Content-type","application/x-www-form-urlencoded"); ajax.send(); ajax.onreadystatechange = function () { if (ajax.readyState==4 && ajax.status==200) {     document.getElementById("eyou_arcclick_1712818382_"+aid).innerHTML = ajax.responseText;  } } }

                                      除此以外,波形智能的数据天生团队还安排了一套援救 RAG-aware training 的数据天生计划,过滤 / 精选出了一系列输出实质昭着基于其他实质的样本,通过 10 余个常用的 RAG 模版,构制出了 10 万余条的 RAG 陶冶数据,使得 Weaver 模子可能原生援救 RAG,可能连合参考文献和范文举行高质料的创作 / 仿写。除此以外○○,团队还安排了一套让 Weaver 援救 Function Calling 的数据天生计划。最终 Weaver 的微调数据量总和到达了 100 万 + 量级。

                                      比拟 OpenAI 等公司的程序众包标注指令数据的流程,波形智能的标注战术更高效 (众包标注者只需求挑选特定界限高质料的实质即可,后续标注流程由 AI 竣事),而众包标注和目前常用的 self-instruct 类的全主动标注流程比拟,波形智能的标注流程可能天生更高质料的数据 (由于输出是手工挑选的高质料实质或个中的一局部)。基于这个战术□NG南宫28官网登录,波形智能的大模子团队汇集了涵盖小说写作,创意写作□○,专业写作,营销文案写作这四大界限中高质料的实质并举行了主动化标注,产出了 100 万 + 高质料的写作界限指令微调数据集○□。

                                      本文为倾盆号作家或机构正在倾盆讯息上传并宣告□,仅代外该作家或机构看法,不代外倾盆讯息的看法或态度,倾盆讯息仅供应新闻宣告平台。申请倾盆号请用电脑访谒。

                                      正在指令微调阶段利来娱乐体育平台□□,波形智能的数据天生团队参考并校正了 Meta 提出的 LongForm 和 HumpBack 计划,构修了一套能够基于一段高质料实质利来娱乐体育平台中文创意写作才智超GPT-4“最会写”的中文大模子Weaver来了NG南宫28官网登录,主动天生各样写作联系做事指令和对应的高质料输出的 Instruction Backtranslation 流水线。团队总结并界说了 “写实质”,“写概要”,“扩写”,“修饰”,“精简”,“品格转移 (仿写)”,“审校”,“思想风暴”,“起题目”○,和 “写作联系对话” 十个种别的做事□○。看待一类做事□,如 “修饰”,标注 Prompt 中开始阐明做事的界说和几个输入输出样例,之后给出一个从一段文本中主动发现修饰做事指令 / 输入 / 输出的例子和标注的思虑历程: “开始正在文本中找到一段写的很好的句子□□,假设这句话是经历一次修饰而来的,之后揣摩正在修饰之前这句话会是什么花式,终末领悟修饰前后的蜕化,推理出修饰的指令会是什么花式写”的中文大模子Weaver来了NG南宫28官网登录。” 之后标注的 Prompt 中输入需求标注的例子并指示大模子按循例子中的标注流程举行输出□○,终末 parse 出模子输出中标注的 “指令 / 输入 / 输出” 局部○○,组合成一条写作指令数据○□。

                                      评估结果显示○□,Weaver Ultra 正在 Benchmark 中对天生实质的别致度和文风的评估中比照席卷 GPT-4 正在内的通用大模子均有明显领先,正在天生实质的畅达性和贴题水平上也和行业领先的 GPT-4 相当,领先其他开源 / 闭源模子○。而其他较小的 Weaver 模子也都正在各项目标中比拟大 2-3 倍的通用大模子有昭着上风。

                                      为解析决这个题目○□,陶冶出更适合专业写作的大模子○□,波形智能的查究团队领悟了为什么 GPT 和其他通用大模子都做欠好创意写作类做事。开始○□,通用大模子的预陶冶历程,由于盼望让模子正在更众的数据中自监视进修,预陶冶的数据鸠合通常会包罗极端众的低质料实质,真正由专业作家和实质创作家写作的高质料文本实质或许只占预陶冶数据总量的 0.1% 不到。是以□○,经历预陶冶后的发言模子正在修模了全盘互联网的文天职散之后□○,自然会目标于输出较为平凡的实质。而正在模子的对齐阶段,OpenAI 等公司众包标注指令微调数据集的历程中的标注员的哺育 / 写作程度有限,没有对标注者的写作 / 创作才华举行筛选○。此外标注的历程中的程序也厉重夸大回复的无害性 (harmlessness) 和有用性 (helpfulness),而没有研究回复实质的创造性和发言 / 写态度格。是以□○,经历指令微调的发言模子反而更容易天生平凡无趣的文字。终末,正在 RLHF/DPO 等 alignment 算法中,模子的陶冶数据和 Reward Model 均由经历指令微调后的模子天生或陶冶取得,是以看待文风和创造性上,RLHF/DPO 的历程也只可是 “矮子里拔将军”,无法深化出真正擅长写作的大模子。

                                      Weaver 模子家族一共席卷四个分歧巨细的模子,名字叫做 Weaver-mini/base/pro/ultra, 区别席卷 18 亿○,60 亿,140 亿和 340 亿参数。为了评估 Weaver 模子和通用大模子的写作才华,波形智能的模子评估团队构修了一个新的用户大模子专业写作才华评估的 Benchmark。Benchmark 中精选了涵盖四大写作界限 30 余个子界限的十项写作做事的有代外性指令,共包罗 2000 + 条指令□。团队汇集了 Weaver 和 10 余个有代外性的开源 + 闭源模子正在 Benchmark 上的输出,并区别举行了人工比照评估和基于 GPT4 的主动评估。

                                      接下来,正在对齐 (Alignment) 阶段,波形智能的数据天生团队提出了 Constitutional DPO, 一套全新的,基于法则高效将模子和专业作家 / 创作家对齐的计划○。和以往基于模子输出 + 人类 / 大模子评估的对齐战术分歧。Constitutional DPO 以人类创作家创作的高质料的输出举动正样本,使用人类作家 / 编辑摒挡提炼出的各个界限写作的 “法则 (Principles)”利来娱乐体育平台中文创意写作才智超GPT-4“最会写”的中文大模子Weaver来了NG南宫28官网登录,,用这些法则去天生可能教会模子更好地听从这些法则的负样本□。实在来说,专业作家 / 编辑开始摒挡出四大界限十个做事中○,好的实质需求坚守的共 200 余条法则○□。看待每一个法则□,编辑总结出法则的详尽阐明和一对相符 / 违背该法则的例子□,并用几句话阐明出相符 / 违背法则的来源□。之后□□,看待每一个正样本,负例天生的 prompt 中开始出现出界限 - 做事上的法则齐集和法则对应的例子和阐明,之后出现出正样本○□,条件大模子领悟出正样本最相符哪几条法则,并推理出若何窜改可能正在作出较少更改的情形下让正样本转而违背这个法则,从而造成一条质料没那么好的输出。团队精选了各个界限高评分 / 高阅读量 / 高点赞评论数的实质举动正样本,通过 Consitutional DPO 的流水线天生出了数万条偏好数据 (preference data),并使用这些数据对模子使用 DPO 举行了对齐陶冶○○。

                                      ChatGPT 等通用大模子援救的成效成百上千,然则看待平凡普通用户来说,智能写作肯定是最常睹的○,也是大模子最能真正助上忙的操纵场景之一。虽然大模子通常能写出看起来像模像样的文字,然则大大都情形下实质的创意水平和文风都经不起追究。特别是正在创作界限□,大模子常睹的 “GPT 文风” 更是让使用大模子举行创意写作看起来大略,现实却障碍重重。

                                      基于此察看○□,波形智能的大模子团队提出了一个特别适合创意写作界限的垂域专业模子陶冶 pipeline,并基于此计划陶冶了 Weaver○□,一个环球领先的创意写作大模子。该计划笼盖了模子的 (接连) 预陶冶,指令微调 (instruction tuning),和对齐 (RLHF/DPO) 阶段。正在预陶冶阶段○,团队举行了极端防备的数据筛选和过滤,使用人工 + 法例 + 机械进修模子协同的计划,从开源预陶冶数据鸠合找到了高质料的小说 / 短故事 / 创意文案等种别的文本实质,舍弃掉了大方的低质料实质和代码 / 广告等数据,并下采样了一局部高质料的讯息数据,同时连合了大范围的私有创作界限数据 (小说,短故事等),构修出了赶过 200B 的能够让模子用心进修创作才华的预陶冶数据。

                                      克日○,波形智能的大模子团队宣告了一款专精 AI 写作的专业大模子 Weaverj9九游会。通过写作界限专业预陶冶和一套更始性的数据天生和 Alignment 算法,Weaver 正在写作界限的各样做事上均得到了领先 GPT-4 和浩瀚中文通用大模子的成效,特别是正在天生实质的创意性和文风质料上大幅领先,是一款更能写出 “人话” 的大模子。

                                      除了程序 Benchmark 的人工和主动评估以外利来娱乐体育平台中文创意写作才智超GPT-4“最会,波形智能的模子评估团队还正在包罗人机交互的现实使用场景中对 Weaver Ultra 和 GPT-4 举行了用户体验测评。由 4 位人类写手正在同样的 Chat Interface 区别操纵 Weaver Ultra 和 GPT-4,以无别的重心区别创作一个短故事,一个小红书文案○,一个贸易设计书,和一个课程论文。测评结果显示,人类写手使用 Weaver 举行创作的服从比拟操纵 GPT-4 提拔了约 40%,而专业编辑对创作实质的质料评选中也以 9:3 的比分更目标于采用 Weaver 创作的文案。领悟显示○,Weaver 带来的服从提拔厉重来自于天生实质的文风更得体,需求的后编辑更少,以及创作历程中 Weaver 交互特别直接,不会输出无用的空话和疑义。而来自专业编辑的反应厉重鸠合正在基于 Weaver 创作的作品品格往往更相符意用程序,以及创作的实质个体致水平更高,不拘束。

                                      ChatGPT 等大模子正在通用指令随同和问答做事中成效特出,然则将大模子使用于专业写作,特别是需求创造性和性子化文风的创意写作界限却仍然面对重重损害。个中最大的题目即是大模子天生实质品格过于平平○,或者说文风过于 “GPT”,缺乏创造性。

                                      【中文浓缩】SpaceX将为星舰助推器3安置两台猛禽引擎,大吊机结果再次抬起

                                    if (!window.jQuery) { document.write(unescape("%3Cscript src='/public/static/common/js/jquery.min.js' type='text/javascript'%3E%3C/script%3E")); document.write(unescape("%3Cscript type='text/javascript'%3E try{jQuery.noConflict();}catch(e){} %3C/script%3E")); } if (window.jQuery) { (function($){ default_switch(); //简体繁体互换 function default_switch() { var home_lang = getCookie('home_lang'); if (home_lang == '') { home_lang = 'cn'; } if ($.inArray(home_lang, ['zh','cn'])) { var obj = $('#jquerys2t_1573822909'); var isSimplified = getCookie('jquerys2t_1573822909'); if ('cn' == isSimplified) { $('body').t2s(); $(obj).text('繁體'); } else if ('zh' == isSimplified) { $('body').s2t(); $(obj).text('简体'); } } } //简体繁体互换 $('#jquerys2t_1573822909').click(function(){ var obj = this; var isSimplified = getCookie('jquerys2t_1573822909'); if ('' == isSimplified || 'cn' == isSimplified) { $('body').s2t(); // 简体转繁体 setCookie('jquerys2t_1573822909', 'zh'); $(obj).text('简体'); } else { $('body').t2s(); // 繁体转简体 setCookie('jquerys2t_1573822909', 'cn'); $(obj).text('繁體'); } }); })(jQuery); }