互动
最近评论
标签
寻找感兴趣的领域
ROUGE
1
IBM Informix
1
F1
1
docker compose
1
MRR
1
AdamW
1
Jupyter
1
React
1
Arch
1
Recall
1
AttentionMask
1
HuggingFace
4
SSL
1
Cross Entropy
1
SubModule
1
Loss
3
Recall@K
1
KSP
0
Accuracy
1
vps
1
GRUB
1
IBM Db2 LUW
1
证书签发
1
Windows
5
Intellij
1
Windows 11
4
exFat
1
acme.sh
1
Precision
1
MultiheadAttention
1
分区管理
1
KAPT
0
NDCG
1
TDR
0
Dropout
1
Rime
1
Conda
1
EditorConfig
0
KV Cache
1
Winget
1
Garuda
1
双系统
2
WSL2
2
Perplexity
1
MHA
1
Bias
1
Projection
2
annotationProcessor
0
Exact Match
1
DB2 iSeries (AS400)
1
DiskPart
1
Gradle
0
Hamming Loss
1
Git
2
Xray
1
Jimmer
1
ssh
1
NLP
16
Java
0
Ubuntu
2
分词
1
Kotlin
0
Linux
2
小米
1
Transformer
2
Tokenizer
1
BLEU
2
LLM
17
Python
1
文章
四月 2026
5
篇
三月 2026
1
篇
二月 2026
2
篇
十一月 2025
1
篇
十月 2025
2
篇
九月 2025
2
篇
八月 2025
2
篇
七月 2025
3
篇
六月 2025
9
篇
八月 2024
3
篇
七月 2024
1
篇
六月 2024
3
篇
四月 2024
2
篇
三月 2024
3
篇
二月 2024
1
篇
功能
显示模式
标签
ROUGE
1
IBM Informix
1
F1
1
docker compose
1
MRR
1
AdamW
1
Jupyter
1
React
1
Arch
1
Recall
1
AttentionMask
1
HuggingFace
4
SSL
1
Cross Entropy
1
SubModule
1
Loss
3
Recall@K
1
KSP
0
Accuracy
1
vps
1
GRUB
1
IBM Db2 LUW
1
证书签发
1
Windows
5
Intellij
1
Windows 11
4
exFat
1
acme.sh
1
Precision
1
MultiheadAttention
1
分区管理
1
KAPT
0
NDCG
1
TDR
0
Dropout
1
Rime
1
Conda
1
EditorConfig
0
KV Cache
1
Winget
1
Garuda
1
双系统
2
WSL2
2
Perplexity
1
MHA
1
Bias
1
Projection
2
annotationProcessor
0
Exact Match
1
DB2 iSeries (AS400)
1
DiskPart
1
Gradle
0
Hamming Loss
1
Git
2
Xray
1
Jimmer
1
ssh
1
NLP
16
Java
0
Ubuntu
2
分词
1
Kotlin
0
Linux
2
小米
1
Transformer
2
Tokenizer
1
BLEU
2
LLM
17
Python
1
播放音乐
折翼天使
文章归档
首页
关于
0
文章
41
2026
2026-04-05
从 Loss 到微分,模型是怎么学习的?
LLM
Transformer
Projection
Loss
•
2026-04-03
衔言渡意:中英法,六个方向
LLM
NLP
•
2026-04-03
NLP评估指标:你的模型到底好在哪
NLP
LLM
BLEU
Accuracy
Exact Match
Precision
Recall
F1
Hamming Loss
Loss
ROUGE
Recall@K
MRR
NDCG
Perplexity
Cross Entropy
•
2026-04-03
训练控制的统计化——当 loss 和评估分数开始撒谎
LLM
NLP
Loss
AdamW
Dropout
BLEU
•
2026-04-03
KV Cache 实现手记——高估了,低估了,然后搞懂了
LLM
NLP
KV Cache
MHA
MultiheadAttention
Bias
AttentionMask
Transformer
Projection
•
2026-03-31
模型容量不够——下一步是加层还是加宽?
NLP
LLM
•
2026-02-27
从数据反推模型架构:一个小模型训练的经验公式
LLM
NLP
•
2026-02-27
通用 Tokenizer 评估方案——从项目专用到任务无关
LLM
NLP
分词
Tokenizer
•
2025
2025-11-01
数语觅类:"nl是什么?27是年龄吗?"
NLP
LLM
•
2025-10-31
韵染流光 • 其一:代码三百行
LLM
NLP
•
1
2
3
4
下页
你好啊!我是
折翼天使
了解更多
最新评论
最近发布
从 Loss 到微分,模型是怎么学习的?
2026-04-05 14:50:41
衔言渡意:中英法,六个方向
2026-04-03 21:46:26
NLP评估指标:你的模型到底好在哪
2026-04-03 21:09:22
训练控制的统计化——当 loss 和评估分数开始撒谎
2026-04-03 19:07:51
分类
溯源 • 求索 • 笃行
6
AI
11
系统
2
Linux
2
网络跳跃
1
开发
6
小技巧
9
SQL
3
数据库
3
繁
复制选中文本
粘贴文本
引用到评论
新窗口打开
复制链接地址
复制此图片
下载此图片
新窗口打开图片
站内搜索
百度搜索
播放音乐
切换到上一首
切换到下一首
查看所有歌曲
复制歌名
随便逛逛
博客分类
文章标签
复制地址
关闭热评
深色模式
轉為繁體