Zhao Dongyu's Blog

gdb

Posted on 2023-06-19 Edited on 2024-09-27
Symbols count in article: 345 Reading time ≈ 1 mins.

今天遇到段错误，旁观大佬一番操作定位解决。

大大提高开发效率的关键几步，值得记录一下。

Roofline model学习

Posted on 2023-06-05 Edited on 2024-09-27
Symbols count in article: 258 Reading time ≈ 1 mins.

给定特定的计算平台，我们的算法实现是不是已经榨干硬件平台的最大能力，还有没有进一步改善的空间？这些问题寻寻觅觅答案，真像雾里看花，我们渴望有一双慧眼，帮我们穿透迷津。

学习Roofline，有一种理论指导实践的感觉。

Final Cut study notes

Posted on 2023-07-08 Edited on 2024-09-27
Symbols count in article: 1.2k Reading time ≈ 1 mins.

学习Final Cut Pro的笔记，提高生产力。

git

Posted on 2023-06-19 Edited on 2025-08-01
Symbols count in article: 2.7k Reading time ≈ 2 mins.

日常的一些git操作其实已经非常熟悉了，比较欠缺的是团队协作遇到的一些问题。

在此记录一下需要经常查阅的情景。

LaTeX学习

Posted on 2023-05-30 Edited on 2024-09-27
Symbols count in article: 427 Reading time ≈ 1 mins.

今天看的论文的排版真的太好看了！开始学习LaTeX，整个过程记录一下。

万物皆可RSS

Posted on 2023-06-29 Edited on 2024-09-27
Symbols count in article: 1.7k Reading time ≈ 2 mins.

万物皆可RSS！

Hello World

Posted on 2018-09-10 Edited on 2024-09-27
Symbols count in article: 367 Reading time ≈ 1 mins.

Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.

Marlin代码解读

Posted on 2024-09-26 Edited on 2024-11-05 In 技术
Symbols count in article: 28k Reading time ≈ 26 mins.

Marlin Kernel是IST-DASLab 开发的GPTQ量化模型高性能 FP16(activation) x INT4(weight) GEMM算子实现，在现有W4A16 GEMM Kernel中，Marlin Kernel性能是最好的。

作为一个不会cuda的小白，研究完marlin算子之后神清气爽，

【长文预警 & 多图预警】

ComfyUI

Posted on 2024-10-31 Edited on 2024-12-23 In 技术
Symbols count in article: 1.5k Reading time ≈ 1 mins.

开始学习 ComfyUI，学学文生图相关的知识

Marlin fp8

Posted on 2024-10-18 Edited on 2024-11-05 In 技术
Symbols count in article: 4.4k Reading time ≈ 4 mins.

vLLM 支持 FP8(W8A8)了，开始学习fp8 ，写一个 FP8(W4A8)算子，减少一些IO吞吐，看看能不能提升性能。