讲座思考 | 周志华教授:新型机器学习神经元模型的探索

12月22日,有幸听了南京大学周志华教授题为“新型机器学习神经元模型的探索”的讲座。现场热闹非凡,大家像追星一样拿着“西瓜书”找周教授签名。周教授讲得依旧循循善诱,由浅入深,听得我很入迷,故作此记。

周教授首先就人工智能领域火热发展的原因提出了自己的见解,强调了人工智能中基础算法相较于算力的基础性作用:算力提升论或为误解,应当是算法带来基础性突破,然后算力的提升才能在其后一段时间内放大算法突破带来的红利。 周教授随后举例说明,BP算法在深层神经网络里存在着梯度消失问题,而2006年随着Hinton的深层模型问世,深度学习一直在近二十年的时间内火热不已,并随着算力不断提升在不同领域有着越来越亮眼的表现。

接着周教授乘势抛出了两个贯穿本次演讲始终的公式:“神经网络=神经网络模型+学习算法”,而神经网络模型=神经元模型+网络结构。周教授解释道,学习算法指的就是BP算法这种历久弥新的算法,而本次演讲的重点——神经元模型,指的就是受生物神经元接受多个电信号输入,达到阈值后激活并输出的启发,所设计的机器学习神经元数学模型,即著名的M-P神经元模型,形如:

y = f ( ∑ i = 1 n w i x i − θ ) y = f(\sum_{i=1}^n w_i x_i - \theta) y=f(i=1nwixiθ)

生物神经元

周教授指出,关于神经网络的大多数研究都注重在网络结构上做设计,而关于神经元模型的研究甚少,甚至问世近80年的M-P神经元模型到今天仍然遍地在用。此外,近来关于神经元模型的研究又开始有所浮现,讨论能否有别的神经元模型可以使用。在这样的背景下,周教授团队着手了新型神经元模型的相关研究。

周教授首先分享了他们团队在分岔脉冲神经网络 (Bifurcation Spiking Neural Network) 方面的研究1

首先,脉冲神经网络中一种被广泛研究的神经元模型叫做Leaky integrate and fire (LIF) 模型,LIF神经元模型除了考虑信号的传递和神经元激活,还考虑了信号传递的时间累计过程,其一般形式为:

τ d u d t = − u + R f ( I ( t ) ) \tau \frac{du}{dt} = -u + R f(\bold{I(t)}) τdtdu=u+Rf(I(t))

周教授团队从动力系统视角进行分析,发现基于LIF神经元模型的脉冲神经网络的解空间是分开的三部分,由参数 τ \tau τ决定。因此提出了分岔脉冲神经网络(Bifurcation Spiking Neural Network, BSNN),实现了自适应动力系统,将解空间连起来,解决了解空间分岔的问题,使得解空间可达。

周教授进一步分享了他们团队提出的一种生物上合理且具有灵活的突触可塑性的全新神经元模型:Flexible Transmitter (FT) Model 2.
这种FT神经元模型参考了生物神经元的神经递质传递过程,尤其是突触的收缩和发育过程,神经递质不仅起到信号传递作用,还会控制突触发育和收缩,使得神经递质的接受量相应增大和缩小,这一过程如下图所示。

生物神经元中突触的神经递质传递与突触伸缩过程

FT神经元模型可以表示为:

( s t , r t ) = f ( w x t , v r t − 1 ) (s_t,r_t) = f(wx_t,vr_{t-1}) (st,rt)=f(wxt,vrt1)

用复数进行数学上的抽象可表示为:

s t + r t i = f ( w x t , v r t − 1 i ) s_t +r_t \bold{i} = f(wx_t,vr_{t-1} \bold{i} ) st+rti=f(wxt,vrt1i)

周教授强调,这种FT神经元模型的能力更加强大,因为M-P神经元模型只是FT神经元模型的一个子集。

一种简单基于FT神经元模型的FT神经网络 (FTNet) 同样也被展示:

s t + r t i = f ( W x t , V r t − 1 i ) \bold{s_t} +\bold{r_t i} = f( \bold{Wx}_t, \bold{Vr}_{t-1} \bold{i} ) st+rti=f(Wxt,Vrt1i)

周教授认为,这种新型FT神经元模型和基于其上的FT神经网络具有更加强大的能力,可以解决以前基于M-P神经元的神经网络无法解决的问题。周教授团队在一些简单的任务上和常见的神经网络进行对比,例如在MNIST数据集上,和CNN、RNN、基于M-P神经元的FCN、基于脉冲神经网络的SNN等,结果显示基于FT神经元的神经网络具有最高的Accuracy。但这并非没有代价,周教授毫不掩饰地指出了FT神经网络存在的问题,即更多的计算时间。

演讲结束后,老师同学们都很感兴趣,不断提出自己的疑惑并向周教授请教。而周教授也非常耐心、坦诚地回答,整个问答环节持续了超过半小时。


  1. Zhang, Shao-Qun, Zhao-Yu Zhang, and Zhi-Hua Zhou. “Bifurcation spiking neural network.” The Journal of Machine Learning Research 22.1 (2021): 11459-11479. ↩︎

  2. Zhang, Shao-Qun, and Zhi-Hua Zhou. “Flexible transmitter network.” Neural Computation 33.11 (2021): 2951-2970. ↩︎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/266519.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Python 运算符 算数运算符 关系运算符 赋值运算符 逻辑运算 (逻辑运算符的优先级) 位运算 成员运算符 身份运算符 运算符的优先级

1 运算符算数运算符关系运算符赋值运算符逻辑运算逻辑运算符的优先级 位运算布尔运算符移位运算符 成员运算符身份运算符运算符的优先级 运算符 算数运算符 四则运算 - * / a 8 b 9 print(ab)#与Java类似 也可以进行字符串的连接 注意:字符串数字字符串 不存在会抛出异常…

Featured Based知识蒸馏及代码(3): Focal and Global Knowledge (FGD)

文章目录 1. 摘要2. Focal and Global 蒸馏的原理2.1 常规的feature based蒸馏算法2.2 Focal Distillation2.3 Global Distillation2.4 total loss3. 实验完整代码论文: htt

实战经验分享:开发同城外卖跑腿小程序

下文,小编将与大家一同探究同城外卖跑腿小程序的开发实战,包括但不限于技术选型、开发流程、用户体验等多个方面。 1.技术选型 在同城外卖跑腿小程序的开发中,技术选型是至关重要的一环。对于前端,选择了使用Vue.js框架&#xff…

Python电能质量扰动信号分类(二)基于CNN模型的一维信号分类

目录 前言 1 电能质量数据集制作与加载 1.1 导入数据 1.2 制作数据集 2 CNN-2D分类模型和训练、评估 2.1 定义CNN-2d分类模型 2.2 定义模型参数 2.3 模型结构 2.4 模型训练 2.5 模型评估 3 CNN-1D分类模型和训练、评估 3.1 定义CNN-1d分类模型 3.2 定义模型参数 …

论文阅读——BLIP-2

BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models 1 模型 在预训练视觉模型和预训练大语言模型中间架起了一座桥梁。两阶段训练,视觉文本表示和视觉到语言生成学习。 Q-Former由两个转换器子模块组成&am…

六大开源 OA 办公系统

OA,即Office Automation的缩写,意思是办公自动化、协同办公。在现代办公环境中,办公自动化已经成为了必不可少的一部分,它可以代替办公人员传统的手动部分或重复性业务活动,优质而高效地处理办公事务和业务信息,实现对…

Openwrt AP 发射 WiFi 信号

问题 想一次把 OpenWrt 路由器 wifi 问题给解决,完全取代路由器。 使用 倍控的 N5105 设备,有 mPCIe 接口,使用了 intel AX200 无线网卡,支持 2.4G 与 5G。 设置步骤 OpenWrt 镜像 第一次使用的镜像不支持 wifi,在…

模式识别与机器学习(八):决策树

1.原理 决策树(Decision Tree),它是一种以树形数据结构来展示决策规则和分类结果的模型,作为一种归纳学习算法,其重点是将看似无序、杂乱的已知数据,通过某种技术手段将它们转化成可以预测未知数据的树状模…

论文笔记--Learning Political Polarization on Social Media Using Neural Networks

论文笔记--Learning Political Polarization on Social Media Using Neural Networks 1. 文章简介2. 文章概括3. 相关工作4. 文章重点技术4.1 Collection of posts4.1.1 数据下载4.1.2 数据预处理4.1.3 统计显著性分析 4.2 Classification of Posts4.3 Polarization of users 5…

自然语言处理(NLP):理解语言,赋能未来

目录 前言1 什么是NLP2 NLP的用途3 发展历史4 NLP的基本任务4.1 词性标注(Part-of-Speech Tagging)4.2 命名实体识别(Named Entity Recognition)4.3 共指消解(Co-reference Resolution)4.4 依存关系分析&am…

1855_emacs_compnay的使用探索

Grey 全部学习内容汇总: GitHub - GreyZhang/editors_skills: Summary for some common editor skills I used. 1855_emacs_compnay的使用探索 company其实是一个老伙伴了,之前我emacs中体验提升的主力插件之一。主要是用来做各种场景下的补全&#x…

物联网产品设计,聊聊设备OTA的升级

物联网产品设计部分的OTA设备固件是一个非常重要的部分,能够实现升级用户服务、保障系统安全等功能。 在迅速变化和发展的物联网市场,新的产品需求不断涌现,因此对于智能硬件设备的更新需求就变得空前高涨,设备不再像传统设备一样…

simulinkveristandlabview联合仿真——模型导入搭建人机界面

目录 1.软件版本 2.搭建simulink仿真模型 编译错误 3.导入veristand并建立工程 4.veristand导入labview labview显示veristand工程数据 labview设置veristand工程数据 运行labview工程 1.软件版本 matlab2020a,veristand2020 R4,labview2020 SP…

7种常见的网络安全设备及其功能

网络安全设备在现代网络环境中起着至关重要的作用,帮助保护个人和组织免受恶意攻击。本文将介绍7种常见的网络安全设备,包括防火墙、入侵检测系统、反病毒软件、数据加密设备、虚拟私人网络、安全信息和事件管理系统以及网络访问控制设备,并详…

阅读笔记-A Cluster Separation Measure

A Cluster Separation Measure(一种聚类分离测度) 1.这篇论文要解决什么问题?要验证一个什么科学假设? 问题是确定数据中聚类的适当数量,解决这种问题的两种方法都取决于确定指数中相对较大的变化,而不是…

将PPT的图保持高分辨率导入到Word / WPS中

1、将PPT中画好的图组合在一起,选择组合后的图复制(Ctrlc) 2、在Word中,选中左上角的粘贴选项--->选择性粘贴 WPS选择元文件 / Word选择增强型图元文件 这样放大也不模糊了

Gateway API

Gateway API 目录 原文链接 https://onedayxyy.cn/docs/GatewayAPI 本节实战 实战名称🚩 实战:Gateway API在istio里的安装及测试-2023.12.23(测试失败) 前言 Gateway API 是由 SIG-NETWORK 社区管理的开源项目,项目地址:http…

【一起学Rust | 框架篇 | Tauri2.0框架】Tauri2.0环境搭建与项目创建

文章目录 前言一、搭建 Tauri 2.0 开发环境二、创建 Tauri 2.0 项目1.创建项目2.安装依赖4. 编译运行 三、设置开发环境四、项目结构 前言 Tauri在Rust圈内成名已久,凭借Rust的可靠性,使用系统原生的Webview构建更小的App 以及开发人员可以灵活的使用各…

阿里云 ARMS 应用监控重磅支持 Java 21

作者:牧思 & 山猎 前言 今年的 9 月 19 日,作为最新的 LTS (Long Term Support) Java 版本,Java 21 正式 GA,带来了不少重量级的更新,详情请参考 The Arrival of Java 21 [ 1] 。虽然目前 Java 11 和 Java 17 都…

AI创作系统ChatGPT系统源码,支持Midjourney绘画,GPT语音对话+DALL-E3文生图

一、前言 SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型国内AI全模型。本期针对源码系统整体测试下来非常完美,可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI创作Ch…