yao 发表于 1-20 22:53

DeepMind 发布全新模型设计工具 Tracr:从可解释逻辑反向搭建模型

DeepMind 发布全新模型设计工具 Tracr:从可解释逻辑反向搭建模型

「可解释性」一直是深度学习难以绕过的难题,用户无法理解模型的运行机制,也就无法放心地把模型应用到实际场景中。

最近来自苏黎世联邦理工学院和 DeepMind 的研究人员提出了一种全新的模型构造工具 Tracr,直接由人来根据「已知的机制」针对不同任务编写代码,然后由 Tracr 编译成模型的权重,让模型的解释变得更轻松。

Tracr 的输入为采用领域特定语言 RASP 编写的代码,输出为标准的、仅包含解码器的、类似 GPT 的 Transformer 结构的权重。

在实验部分,研究人员使用 Tracr 创建了一系列 ground truth Transformers,实现了包括计算 token 频率、排序和 Dyck-n 括号检查等程序。
页: [1]
查看完整版本: DeepMind 发布全新模型设计工具 Tracr:从可解释逻辑反向搭建模型

博一网
www.bo-yi.com
点击查看放大的二维码
订阅号:jc68com
点击查看放大的二维码
服务号:jc68-1
点击查看放大的二维码
移动端二维码
腾讯微博
腾讯微博
新浪微博
新浪微博