数学
1
评估
0
LLM
1
心经
1
健康
0
PaperSharing
1
Paper
0
Benchmark
1
计算机网络
1
OAuth
0
前端
0
爬虫
1
k8s
1
k82
云原生
1
陷阱
1
并发编程
1
RSS
1
持续集成
1
设计模式
1
旅游
项目文档
1
总结
1
技术文档
1
Ascend
1
数智化教育
0
联通主义
0
学与思
1
思悟
1
领导力
0
曾国藩
0
分享
1
Python
1
学习周报
0
微机原理与接口技术
3
实战
1
Java
1
git
2
算法竞赛
1
C
1
容器
1
Docker
2
数据结构与算法
2
实验
1
CS61B
1
高人对话
2
学习方法论
1
全栈
1
MybatisPlus
2
IO
1
单元测试
1
sa-token
1
权限系统
1
开发实践
1
国际化
1
发布订阅
1
线程池
1
日志
1
AOP
1
限流
0
Redis
1
系统设计
2
frp
1
内网穿透
1
操作系统
7
JVM
2
存在主义
1
通义
1
AI
1
SpringCloud
1
踩坑
3
Socket
2
Qt
1
C++
2
项目
2
读书札记
5
心理学
2
Golang
16
分库分表
2
动手学微服务
3
社会实践
3
支教
3
凉山
3
Halo
0
Research
未读
DL数学原理:香农熵、交叉熵、KL散度
DeepSeek-R1最近刷屏全网,与之相随的是有关大模型强化学习的学习热潮。在大模型的强化学习中,有一个概念经常被提及——KL散度。正好最近复习了一下香农熵、交叉熵、KL散度的概念,将他们串在一起将更有利于理解KL散度。 信息量:小概率事件的信息量更大。用-log可以表示这层关系。 熵(香农熵):