3月4日工作记录

周末总结

周末花6.5k的4060ti主机到家了,配好了和女朋友一起玩了两天帕鲁,真好玩!
玩完开始上班!

今天,上午先看三篇paper,然后下午继续1日计划的工作

文章阅读

文章一:SciGLM: Training Scientific Language Models with Self-Reflective Instruction Annotation and Tuning

https://github.com/THUDM/SciGLM

通过自动纠错生成SciInstruct数据集,在SciInstruct数据集上训练ChatGLM得到优于baseline(ChatGLM)的模型。
在这里插入图片描述

  • “从互联网上获得的用于科学问题的指令数据的规模远小于其他任务。科学内容通常需要更高级别的专业知识才能创建,且大多数高质量信息经常受到知识产权的保护。我们能合法访问的大多数数据只包含问题-答案(QA)对,而没有详细的思考链条推理步骤。然而,仅仅训练大型语言模型(LLMs)使用QA对会导致非常糟糕的结果,甚至损害它们的通用语言能力。为了获得高质量的推理步骤作为指令(I),并创建问题-指令-答案(QIA)对,我们提出了一个自我反思的指令标注框架,要求LLM自主地标注、评价和修正推理步骤,几乎不需要人为干预。具体来说,LLM首先尝试仅根据问题(Q)生成推理步骤和答案;然后,对于那些答案预测错误的输出,我们要求LLM自身识别错误类型,基于此来解决错误并修正输出。最后,我们提供给LLM正确的答案,以完成它们的标注指令。这样一个自我反思的标注框架完全利用AI而非人类来收集指令,同时通过仔细的答案检查和LLM自我反思,保证质量并解决现有LL在这里插入图片描述
    M的潜在错误。”

    在这里插入图片描述

  • 由光学字符识别(OCR)提取的真实数据和由自反射框架生成的指令仍然可能包含错误。因此,对未细化的数据进行处理,获得高质量的数据,是提高模型性能的关键。**为了创建高质量的指令并过滤掉噪声数据,我们选择特定的标准问题和答案作为正样本,并使用llm生成相应的负样本。然后可以利用这些样本来训练数据分类器。在整合自我反思标注产生的问题和答案并进行过滤后,我们构建了scidirective,一个包含科学信息的综合数据集,用于微调。**在这项工作中,我们选择双语ChatGLM (Du et al., 2022;Zeng et al., 2022)系列模型作为主干。ChatGLM系列模型是一个开源的对话预训练模型,具有流畅的对话和低部署障碍。通过在scidirective上对ChatGLM系列模型进行微调,得到SciGLM模型。

文章二:LlaSMol: Advancing LLMs for Chemistry with SMolInstruct

https://github.com/OSU-NLP-Group/LLM4Chem
收集和制造了一个总大小3M的指令微调数据集。在开源模型中测试结果是Mistral基座模型科学理解能力最强,所以用Mistral作为基座。

在这里插入图片描述

文章三:ChemLLM: A Chemical Large Language Model

将结构化科学内容转为更贴近LLM-Chat的corpora以避免对预训练大模型能力的破坏。
在这里插入图片描述
主要在name conversion, molecular caption, and reaction prediction三个方面进行测试。从这个表格结果来看,微调模型和GPT4的差距集中体现在反应预测上。

代码任务

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/427438.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

STL——stack

目录 stack stack都有哪些接口 模拟实现一个stack stack 1. stack是一种容器适配器,专门用在具有后进先出操作的上下文环境中,其删除只能从容器的一端进行元素的插入与提取操作。 2. stack是作为容器适配器被实现的,容器适配器即…

【一起学习Arcade】(5):属性规则实例_计算规则

属性规则可改善地理数据库数据集的编辑体验并提高数据完整性。 这些规则均为用户定义的规则,可用于自动填充属性、在编辑操作期间限制无效编辑,以及对现有要素执行质量保证检查。 属性规则分为3类:计算、约束和验证。 这一篇介绍计算规则&…

HOOPS Communicator对3D大模型轻量化加载与渲染的4种解决方案

今天给大家介绍一些关于3D Web轻量化引擎HOOPS Commuicator的关键概念,这些概念可以帮您在HOOPS Communicator流缓存服务器之上更好地构建您自己的模型流服务器。如果您是有大型数据集,那么,使用流缓存服务器可以极大地帮助您最大限度地减少内…

PostgreSQL10.21与PostGIS3.2.3安装文档

背景: 公司需要在一个服务器上装一个pg数据库,要求和其余服务器版本尽量保持一致,临时拉我装一下 特别注意: 需要注意的地方就是因为postgresql数据库是一个空间库,gis行业很多都会使用这个数据库,我们安…

深入Kafka client

分区分配策略 客户端可以自定义分区分配策略, 当然也需要考虑分区消费之后的offset提交, 是否有冲突。 消费者协调器和组协调器 a. 消费者的不同分区策略, 消费者之间的负载均衡(新消费者加入或者存量消费者退出), 需要broker做必要的协调。 b. Kafka按照消费组管理消费者, …

HttpClient—详解、代码演示

简介:HttpClient 是Apache Jakarta Common 下的子项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包,并且它支持 HTTP 协议最新的版本和建议,即可以通过HttpClient可以再Java中构建和发送Http请求。 …

将jar包打包为docker镜像

此记录一下将springboot项目的jar打包成docker镜像记录错误点。 1.将springboot项目打包成jar包 参考博客 : springboot项目打包成jar_springboot打包成jar-CSDN博客 具体打包步骤参考他的如何打包: 使用IDEA进行打包。但是我需要在我的springboot的pom.xml文件里面配置如下插…

javascript实现的星座查询

今天在这个网站http://xzxys.wiicha.com/看到查询星座幸运色的效果,想研究一下代码,结果右键禁用。后来参考了一下别人的代码,琢磨着先实现了一下星座查询的功能,输入月份和日期四位数后,可以查询属于哪个星座&#xf…

如何做代币分析:以 INJ 币为例

如何做代币分析:以 INJ 币为例 作者: lesleyfootprint.network 编译:cicifootprint.network 数据源:INJ 代币仪表板 (仅包括以太坊数据) 在加密货币和数字资产领域,代币分析起着至关重要的作…

网络学习:MPLS技术基础知识

目录 一、MPLS技术产生背景 二、MPLS网络组成(基本概念) 1、MPLS技术简介:Multiprotocol Lable Switching,多协议标签交换技术 2、MPLS网络组成 三、MPLS的优势 四、MPLS的实际应用 一、MPLS技术产生背景 1、IP采用最长掩码…

跨地域传文件时 面临的安全、效率等问题要如何解决?

近年来,企业在异国、异地设立分支机构的越来越多,在日常经营中,企业总部和分支机构间存在平行、垂直及互相交叉的管理模式和业务往来需求,因此,大型企业存在必然的跨地域传文件场景,比如跨地理域文件交换、…

6个常见的动态内存的错误和动态内存经典笔试题

和黛玉学编程..........> 这篇的代码对应知识点就在上一篇啦 常见的动态内存的错误 对NULL指针的解引用操作 void test() { int *p (int *)malloc(INT_MAX/4); *p 20; free(p); } 如果P的值是空指针就会有问题,所以一般都会先进行判断 对动态开辟空间的越…

【无刷电机学习】光耦HCNR200基本原理及应用(资料摘抄)

【仅作自学记录,不出于任何商业目的。如有侵权,请联系删除,谢谢!】 本文摘抄翻译自: https://docs.broadcom.com/wcs-public/products/application-notes/application-note/331/6/av02-1333en-an_5394-16jul10.pdfhtt…

【leetcode】反转字符串 双指针

/*** param {character[]} s* return {void} Do not return anything, modify s in-place instead.*/ var reverseString function(s) {let start0;let ends.length-1;while(start<end){[s[start],s[end]][s[end],s[start]];start;end--;}return s;};双指针&#xff0c;一头…

ST32/GD32——UART串口通信

芯片选型 Ciga Device — GD32F470系列 串口通信 串口通信指的是通过串行通信接口进行数据传输的通信方式&#xff0c;通常用于短距离、低速率的数据传输。 串口通信可以使用不同的串行通信协议和接口&#xff0c;常见的串口通信协议有UART、USART、RS-232、RS-485、SPI、I…

Mybatis_plus-基础

一、简介 1.概述 文档地址&#xff1a;https://baomidou.com/ 概述&#xff1a;MyBatis-Plus (opens new window)&#xff08;简称 MP&#xff09;是一个 MyBatis (opens new window) 的增强工具&#xff0c;在 MyBatis 的基础上只做增强不做改变&#xff0c;为简化开发、提…

解密Lawnchair:打造个性化极致的Android桌面体验

解密Lawnchair&#xff1a;打造个性化极致的Android桌面体验 1. 简介 Lawnchair是一款知名的Android桌面定制工具&#xff0c;旨在为用户提供个性化极致的桌面体验。作为一个开源项目&#xff0c;Lawnchair融合了简洁、灵活和强大的特点&#xff0c;让用户能够自由定制其Andro…

Java基于springboot的课程作业管理系统

摘 要 随着科学技术的飞速发展&#xff0c;社会的方方面面、各行各业都在努力与现代的先进技术接轨&#xff0c;通过科技手段来提高自身的优势&#xff0c;课程作业管理系统当然也不能排除在外。课程作业管理系统是以实际运用为开发背景&#xff0c;运用软件工程原理和开发方法…

1.线程池的实现机制

为什么使用线程池&#xff1f; 在处理并发问题时&#xff0c;倘若我们一个一个创建线程池再进行线程池的销毁&#xff0c;不但浪费资源还增加了上下文切换的开销。线程池主要是以空间来换取时间。 如图所示给任务队列分配在线程池里线程。 线程池用到的模式是半同步、半异步模…

机器学习 | 四大常用机器学习Python库介绍

今天这篇我们介绍下Python中常用的机器学习库(机器学习、深度学习啥的&#xff0c;小编还是建议使用Python进行建模编写哈)&#xff0c;也算是本公号机器学习的第一篇推文&#xff0c;主要内容如下&#xff1a; 机器学习常用四大Python库 关于机器学习的我想说的话 所有完整代…