从零实现一个 mini vLLM--开篇
1. 如果你已经用过大语言模型,大概率写过类似这样的代码: inputs = tokenizer(prompt, return_tensors="pt").to("cuda") outputs = model.generate(**inputs, max_new_tokens=128) text =
1. 如果你已经用过大语言模型,大概率写过类似这样的代码: inputs = tokenizer(prompt, return_tensors="pt").to("cuda") outputs = model.generate(**inputs, max_new_tokens=128) text =
It has been a long time since I last wrote anything here. For a while, I kept telling myself that I would come back to this blog when things slowed do
傍晚的时候,城里很少有人听见钟声。 钟声也许还在。它藏在某座旧楼的高处,藏在灰尘、鸟巢和锈蚀的齿轮之间,按照一种不再被需要的节律,缓慢地敲下去。可街面上有太多更轻、更亮、更急促的声音。手机震动,电梯报站,车轮擦过积水,广告屏在玻璃幕墙上反复刷新。人们从一扇门走向另一扇门,低着头,像被细小的光牵引。黄
一个 GCC编译过程追踪与可视化分析工具,通过在编译流程的关键阶段(预处理、函数解析、优化 Pass 执行等)插入探针,与Perfetto深度集成将GCC原始数据转换为Perfetto Trace格式,实现编译过程的精细化性能分析与可视化。 Github链接:https://github.com/Y
1.1 EventCategory 枚举类型 EventCategory,用于表示不同的事件类别(Event Category),GccTrace代码处理框架中的分类标识 enum EventCategory { TU, PREPROCESS, FUNCTION, STRUCT,
传统编译器 编译器的处理流程可以形象地分为三个阶段: 前端 (Frontend) —— "翻译与检查" 它是编译器的“看门人”。负责读懂源代码,检查有没有语法错误。如果代码没问题,它会把代码翻译成一种通用的内部格式(中间代码),方便后续处理。 优化器 (Optimizer) —— "润色与精简" 它
The Wall of Water You don't just feel the air in Singapore; you wear it. My first act as a student here, before I had even memorized my new address, w
该项目是一个基于 React 的交互式图像处理网站,提供超过 50 种图像处理和特效算法,涵盖基础处理、滤镜、艺术效果、颜色处理、复古风格化、几何变换以及纹理特效等多个类别。用户可以通过网页上传图片、选择算法、调整参数,并实时观看算法进度与动画效果。系统还提供每个算法的数学原理、时间复杂度说明和可视
Empathy‑Avator 是一个离线运行的多模态情绪识别驱动虚拟陪伴系统。它通过摄像头和麦克风采集用户的表情、语音和输入文本,分别进行面部表情识别(FER)、流式语音情绪识别(SER)和文本情绪分析,并利用置信度门控的加权融合生成稳定的情绪标签。系统内置检索增强的对话引擎,根据情绪和关键词在轻量
该仓库实现了一个轻量级的虚拟试衣间原型,目标是在浏览器端通过几何建模和简单的物理模拟,将用户上传的全身照与指定衣物进行“试穿”,并输出可交互的 3D 模型和预览图。项目分为三个核心部分: 姿态估计(Pose) – 使用预定义的标准骨骼根据输入图像尺寸按比例缩放,得到用户的三维关键点和骨架边。 几何与