About 50 results
Open links in new tab
  1. pipeline是什么? - 知乎

    pipeline,中文意为管线,意义等同于流水线。 最典型的就是Gpu渲染管线,它指明渲染一个画面需要经过多少到工序。还有就是应用于爬虫框架里面。它就是指某个项目或者框架里面需要用到流水线的设 …

  2. 为什么Hopper架构上warp-specialization比multi-stage要好? - 知乎

    对于SM90架构的Warp Specialization来说,无论是Producer的TMA指令,还是Consumer的wgmma指令,它们都是异步的,都需要额外的机制来确保指令真正的完成。 对于用户来说,就可以利用异步的 …

  3. 如何搞懂一个销售pipeline? - 知乎

    Apr 11, 2020 · 典型的销售漏斗图(Sales Funnel)销售漏斗or销售管道 (Sales Pipeline) 销售漏斗 也叫做 销售管道 (Sales Pipeline),它是一个形象的概念,是对销售过程控制的重要分析工具。销售 …

  4. Diffusers如何使用本地的模型导入Pipeline? - 知乎

    主要还是Stable Diffusion v1.5版本模型权重的锅,官方上传到HuggingFace repo里的权重格式跟diffusers支持的标准格式不一样,导致用一个safetensors文件存放的时候也有问题,所以报错了。 …

  5. 大模型训练 Pipeline Parallel 流水并行性能有没有什么评价指标?或者 …

    2.3 构建流水线时间表的基本单元 Design pipeline schedule 的前两步,摘自:Pipeline Parallelism with Controllable Memory 原文。 论文 Pipeline Parallelism with Controllable Memory 提出 design pipeline …

  6. 许多人说DeepSeek是从GPT蒸馏出来的,这是真的吗? - 知乎

    We introduce DeepSeek-R1, which incorporates a small amount of cold-start data and a multi-stage training pipeline. Specifically, we begin by collecting thousands of cold-start data to fine-tune the …

  7. transformers的AutoModelForCausalLM和AutoModel有啥区别? - 知乎

    通过结果可以看出文本生成是基于gpt2模型进行推理的,对于回复的结果并没有给出很好的答案。对于这个问题可以基于开源大模型进行回答或者在gpt2模型基础上进行微调和预训练对模型进行调优,达到 …

  8. 大模型训练时ZeRO-2、ZeRO-3能否和Pipeline并行相结合? - 知乎

    如题,pipeline并行一般在多个micro-batch反向计算结束时再同步已经累积的梯度,而ZeRO-2由于切分了梯度…

  9. 深度学习论文中的pipeline 是什么意思? - 知乎

    深度学习论文中的pipeline 是什么意思? 《In-hand Object Scanning via RGB-D Video Segmentation》中有一句“Our pipeline tak… 显示全部 关注者 15 被浏览

  10. 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎

    官网显示模型名为deepseek-V3-600BDeepseek V3的Aider代码能力排行榜正确率为48.4%,仅次于OpenAI o1,超…