简介 目录 评价 推荐
  • 超人归来2020 2025-07-31

    GPT-3训练数据

    Common crawl(filtered)

    WebText2,Reddit论坛的网页文本

    Books1,Books2 互联网书籍语料库

    Wikipedia 维基百科

    0赞 · 0采集
  • 慕容5340618 2025-07-25

    全会后即可嗯嗯你的

    0赞 · 0采集
  • 宝慕林1130973 2025-06-13

    0赞 · 0采集
  • 宝慕林1130973 2025-06-13

    待机时间szjxj

    0赞 · 0采集
  • 慕勒5590012 2025-06-01
    1. 大语言模型参数量基破参数量大一般指的是7b~100b+,即70亿-1000亿+参数
    2. 70亿x4字节*28G
    3. 令参数其实就是一个浮点数 (2字节或4字节L,比如3.1415,所以一个7b的模型,本质上就是一坨70亿以上的数字而已斜
    4. 输入:你是谁=→词表转换[154, 5412,15】
    5. 你:154.是5412.谁15
    0赞 · 0采集
  • weixin_慕神6080252 2025-05-29
    非常好的课程,内容好
    0赞 · 0采集
  • 慕瓜8097738 2025-04-02
    那我现在www咯莫YY
    0赞 · 0采集
  • 蜗牛先生sir 2025-02-23

    大语言模型的大包括训练数据量大、输入参数大
    大语言模型的功能包括语言生成、分类、总结、改写

    0赞 · 0采集
  • 蒲艳屏_nABJY2 2025-02-22
    1.深度学习模型
    训练数据大 3000亿文本
    参数大 b 10亿 7B= 70亿*4=28G
    Token 文本的片段 大模型长度单位
    训练指将大量文本输入模型,进而得到模型参数
    0赞 · 0采集
  • 慕工程5066615 2025-02-14

    tran model

    0赞 · 0采集
  • 慕工程5066615 2025-02-14


    find next token

    0赞 · 0采集
  • 慕工程5066615 2025-02-14


    workflow

    0赞 · 0采集
  • CccZmZb 2025-02-13

    深度学习模型,输入 - 输出

    0赞 · 0采集
数据加载中...
开始学习 免费