嵌入式动态库

简介在 Linux 系统中，动态库（.so）依靠 ELF 动态链接器完成符号解析与运行时绑定，实现了模块复用、升级与内存共享。而在嵌入式系统中，由于缺乏动态链接器、内存受限或执行环境受控，无法使用完整的 ELF 动态加载机制。但嵌入式固件仍常常需要一种“可复用、可升级、可替换”的通用功能模块。本文实现了一种适合嵌入式项目使用的动态库的实现，采用固定地址入口、跳转表（functio...

2025/11/26 教程

DeepSeek-OCR 笔记

简介使用了 Encoder-Decoder transformer 架构： Encoder: DeepEncoder，核心部分，可以将带文字的图片转换成 vision token，对比将这些文字转为通常的 text token，其数量可以减少至 1/10 以下。 Decoder: DeepSeek3B-MoE-A570M 光学压缩的可行性假设有一篇 1000 字的文章...

2025/10/23 学习笔记

面向对象编程(OOP)实战论

前言本文将通过一个实际的案例，通过需求分析、代码编写、OOP 优化的方式来阐述 OOP 在软件开发中的实际用处本文案例将使用 C 语言进行编写，以此表明 OOP 是一种泛用的编程思想，并不是只能应用在 C++/python 之类的面向对象语言上。Linux 内核就用到了大量的面向对象的思想，但它是完全使用 C 语言编写的本文编写时尽可能考虑到了无面向对象基础的读者，但推荐无基础读...

2025/10/16 教程

DeepSeek R1 笔记

特点 DeepSeek R1 的两个关键贡献： Post-Training: Large-Scale Reinforcement Learning on the Base Model（改进的 Post-Training 方式） Distillation: Smaller Models Can Be Powerful Too（小模型同样可以做到很优秀）学习方式概述 ...

2025/10/05 学习笔记

C++ 中的 variant 解析

自己写了一个能自动构造的 union，结果发现和标准库的 variant 重复了，正好研究下示例 template <typename... Types> class StaticUnion { private: // 定义一个union用于分配空间 template <typename T, typename... Rest> unio...

2025/08/15 技术

CUDA 学习笔记

简介传统上，绝大多数软件应用程序都是作为顺序程序编写的，也就是冯·诺伊曼架构。这些程序的执行可以被人理解为根据程序计数器的概念，按顺序逐步浏览代码。程序计数器包含处理器将要执行的下一条指令的内存地址。与之相对的就是并行程序，其中多个执行线程合作以更快地完成工作。异构并行计算 CPU 的设计优化是为了顺序代码性能：算术单元(ALU)和操作数传递逻辑的设计旨在最小化算术操...

2025/07/07 学习笔记

triton 学习

🧾 问题场景输入数组(即一维 Tensor) A: A = [100, 99, 98, ..., 1]（长度 N = 100）我们希望把所有元素乘 2 我们设定：BLOCK_SIZE = 32(每个线程处理 32 个元素) 🧠 核心代码 import torch import triton import triton.language as tl @triton...

2025/07/03 学习笔记

undefined reference 问题查找

问题当编译器在链接报 undefined symbol 时，大部分情况下都会给出函数的调用链，但有些情况下不会给出相关信息，所以需要手动查找假设有如下代码： #include <variant> int main() { std::variant<int,double> v = 1.1; auto i = std::get<int>...

2025/07/01 教程

使用 rclone 挂载远程 webdav 为本地盘

rclone 下载从 https://github.com/rclone/rclone/releases 下载对应的文件，只有命令行工具，没有 gui，包含了 server 和 client。 rclone webdav server 如果服务器没有提供 webdav，可以使用 rclone 自带的 webdav 服务，通过 docker 或使用 rclone cli 即可运行，这里...

2025/06/20 教程

LoRA 技术摘要

简介 LoRA(Low-Rank Adaptation of LLMs)，即 LLMs 的低秩适应，是参数高效微调最常用的方式之一。属于 PEFT(Parameter-Efficient Fine-Tuning) 的一种方式。 LoRA 的本质就是用更少的训练参数来近似 LLM 全参数微调所得的增量参数，从而减少内存的占用。原理对 LLM 做微调的结果可以简要地表示为： [\m...

2025/06/06 教程