. S5 F8 t# Q5 f7 p
海洋覆盖了约 71% 的地球表面,对全球的气候调节、天气模式、生物多样性以及人类的经济发展都扮演着至关重要的角色。海洋科学专注于研究海洋的自然特性、其变化规律以及与海洋资源开发和利用相关的理论、方法与应用。
本文介绍一个为海洋领域打造的大型语言模型——OceanGPT。如图 1 所示,该模型可处理海洋科学的问答和内容生成任务。此外,本文还尝试验证大模型模拟操控水下机器人,探索大模型驱动的水下具身智能的实现。OceanGPT 提供预训练模型的开源下载。
# }) S; ?" v# z4 e s& H 论文名称:
# V% g& D" ]0 P2 A8 q2 U% \* q" G
OceanGPT: A Large Language Model for Ocean Science Tasks
6 r7 E/ D& u& D$ ^9 t2 N 论文链接:
https://arxiv.org/abs/2310.02031
) J3 c0 e: V5 K% K3 z7 z3 r# C# E2 z 模型下载:
https://huggingface.co/zjunlp/oceangpt-7b
▲ 图1 OceanGPT海洋科学问答能力
( [( G/ D: b, V1 ?4 `, f$ m 一、OceanGPT训练
1.1 海洋领域预训练为了训练 OceanGPT,本文构建了专门针对海洋领域的的预训练语料。首先,从开放获取的论文文献中收集文档作为原始语料库,并使用工具将文献文件的内容转化为纯文本。为确保数据的质量,对收集的数据集进行进一步使用正则表达式过滤掉了图表、标题、页眉、页脚、页码、URL 和引用。此外,还过滤了多余的空格、换行符和其他非文本字符。处理后的文档涵盖了海洋科学的各个领域,如海洋物理学、海洋化学、海洋生物学、地质学、水文学等。此外采用了基于哈希的方法对数据进行去重,这有助于在预训练期间降低过拟合的风险,提高其泛化能力。1.2 基于多智能体协同的指令数据生成与微调在指令微调阶段,为了能够解决海洋领域数据难获取的问题,本文设计了一个全新的基于多智能体协同配合的指令数据生成与处理框架—DoInstruct,其能够自动化地收集和生成大量海洋领域指令数据。如图 2 所示,DoInstruct 的海洋数据生成框架依托于大模型多智能体的协作来自动化地生成大量海洋科学指令数据。
▲ 图2 海洋指令构建的算法框架具体来说,每个海洋智能体会扮演对应海洋专家角色,比如扮演海洋生物、海洋气象等子领域的专家。整个框架分为两部分,一部分利用演化算法来不断迭代增加海洋种子数据的知识丰富度,另一部分则训练单独的智能体专门负责从海洋科学文献中抽取数据来提升知识专业度。最后,与海洋科学相关的人工规则被作为提示来确保智能体生成指令数据的质量。
T5 U3 a7 J" b* ?: R" \ S6 x* b 二、OceanGPT评测
2.1 构建海洋领域大模型评测基准-OceanBench本文构建了一个海洋领域评测基准数据集,它可以系统性地评估大语言模型在海洋领域的性能。如图 3 所示,经过自动化评估和人工评估,本文发现 OceanGPT 在 15 个海洋科学任务上表现出相对较好的性能。
▲ 图3 OceanBench实验效果对比2.2 深入分析海洋大模型的能力
▲ 图4 OceanGPT在海洋科学问答场景的效果对于海洋科学问答场景,OceanGPT 在知识丰富度和专业度中展示出更好的效果。具体而言,OceanGPT 在描述如海洋放射性核素防护等研究内容时展现出相对更高的领域知识专长,其文本内容不仅结构清晰、组织有序,而且全面覆盖了放射性核素研究的各个方面,比如从实验设计到数据分析,再到风险评估和处置指南等。
▲ 图5 OceanGPT在模拟操作水下机器人的效果(基于Gazebo模拟器)进一步的,本文探究了 OceanGPT 在模拟操作海洋机器人的能力。通过将代码指令整合到了模型的指令数据中,经训练后发现 OceanGPT 在一定程度上可依靠人类指令来操作水下机器人,使机器人执行基本的路径控制操作。OceanGPT 对海洋机器人的交互进行了初步尝试,可以为大模型驱动的水下具身智能的实现提供参考。
- q, @5 a- ]: S3 o$ C' E 三、使用OceanGPT
6 ?+ T) L q1 G- u6 z
本文在 Hugging Face
) ?$ Y6 D/ p0 W
(https://huggingface.co/zjunlp/OceanGPT-7b) 中提供了 OceanGPT 的使用简易教程。执行以下脚本即可加载和使用 OceanGPT。
>> from transformers import3 `! b3 L( I1 Q. n* w/ T5 Z
pipeline
>> pipe = pipeline("text-generation", model="zjunlp/OceanGPT-7b" q d% Z+ p1 v4 c) U* k
)
>> from transformers import) U+ W# f+ v/ b. H$ p& {' z4 ]. g) H
AutoTokenizer, AutoModelForCausalLM
>> tokenizer = AutoTokenizer.from_pretrained("zjunlp/OceanGPT-7b"
% {* V5 P4 `0 p9 H0 k. S )
>> model = AutoModelForCausalLM.from_pretrained("zjunlp/OceanGPT-7b")
, ?; w2 @) u8 j" L. h! D t OceanGPT 还提供了一个如图 6 所示的在线交互演示系统,并计划在未来更新模型以进一步提升海洋科学任务的能力。更多详情请参阅论文原文。
▲ 图6 OceanGPT演示系统0 v! e6 R( `( Y0 D
作者:毕祯
- L2 G% f& N+ P4 e 来源:公众号【PaperWeekly】
& ~5 F4 ^% K) Y! f Illustration by IconScout Store Delesign Graphics
-The End-
* R6 Z4 }9 i8 j* C$ n5 b
扫码观看!
' P9 W* v* L1 Q) o5 @$ ]
本周上新!
' F( f, y' y& N$ G “AI技术流”原创投稿计划
" U, a8 ]! L3 E" F" a& [
TechBeat是由将门创投建立的AI学习社区(www.techbeat.net)。社区上线500+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。
9 r2 B. o3 U; M1 r9 _( v
投稿内容
D5 q% y* m5 t0 W H // 最新技术解读/系统性知识分享 //
. u2 c8 E* \/ x3 f( W4 Z: ~" r( b% g* p // 前沿资讯解说/心得经历讲述 //
6 S2 Y! d3 P( d7 e% Q; I0 K
投稿须知
% i) r' Z1 S* j& G( Y. b7 X 稿件需要为原创文章,并标明作者信息。
' X3 n- J# r( k; G1 E% | 我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励
" e' p& W! z. t# O$ R$ s$ I% i
投稿方式
) d1 c. x: R# c( z 发送邮件到
' C, S0 q7 L4 u+ { chenhongyuan@thejiangmen.com
c- ?+ ]0 k* f1 D. A 或添加工作人员微信(chemn493)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。
2 q, _: l6 C+ k6 G, O) k; O
>>> 添加小编微信!
关于我“门”▼将门是一家以专注于数智核心科技领域的新型创投机构,也是北京市标杆型孵化器。公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:
⤵一键送你进入TechBeat快乐星球; Z' V8 r ?: D" d8 |1 l9 [ j