北冥有鱼 记录生活点滴,分享学习心得

浅析MLIR在Pass优化中的应用

特别声明:未经授权,禁止转载。 本文源码分析所使用的代码库信息如下: TensorFlow代码库commit id为0d5668cbdc6b46d099bd3abd93374c09b2e8121f(master分支) JAX代码库commit id为af89426a73664b6c58c2a933c0dde0aded8c9391(main分支,且使用上述tf对应...

论文分享

DISC : A Dynamic Shape Compiler for Machine Learning Workloads

背景和动机 概览 系统设计 示例讲解 主要Pass Pipeline介绍 实验评估 论文链接 DISC : A Dynamic Shape Compiler for Machine Learning Workloads

使用slidev创建幻灯片

基于markdown编写幻灯片

1. slidev安装与项目初始化 slidev requires Node.js >= 14.0 创建幻灯片工程目录slides-project,并在该目录下安装slidev,然后进行项目初始化 1 2 3 4 5 6 7 8 9 10 # 为了方便统一文件管理,建议将slides-project目录创建在wzzju.github.io项目根目录下, # 并将s...

VIM高级使用技巧

vim + tmux + autojump

VIM是远程开发场景中必不可少的编辑器,amix/vimrc提供了一些有用的配置,本文对其安装及使用技巧进行记录。 1. 升级VIM版本 推荐使用如下命令将VIM版本升级到8.2及以上。 1 2 3 4 5 add-apt-repository ppa:jonathonf/vim apt update apt purge -y vim apt autoremove -y apt i...

JAX程序转HLO执行

本文使用的JAX源码commit id:4dd1f001c626eb15f1a8deac58d97b578a1bd85c 1. 源码编译debug版本JAX 1.1 准备工作 下载JAX源码:git clone https://github.com/google/jax.git 修改根目录下的WORKSPACE文件,以使用指定commit id版本TensorFlow...

gdb常用命令总结

安装gdb-10 执行如下命令可在Ubuntu 18.04 LTS系统中安装自带源码高亮功能的gdb-10: 1 2 3 4 5 6 apt install -y software-properties-common # 若遇到ModuleNotFoundError: No module named 'apt_pkg'问题,只需 # 将/usr/bin/add-apt-repositor...

有用的C++程序片段

生成随机数 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 #include <cstdlib> #include <ctime> // "int rand(void)" returns a pseudo-random integer // value between 0 and RAND_MAX (0 ...

Raspberry Pi初始化开发流程

无显示屏设备联网与配置

1. 工具准备 在software/operating-systems上下载Raspberry Pi OS with desktop的torrent文件,并使用qBittorrent工具打开得到的torrent文件以下载raspios-xx.zip文件,解压后可得到对应的raspios-xx.img文件。 使用SDFormatter格式化准备好的SD卡(建议8GB以上)。 使...

XLA Pass功能分析

特别声明:未经授权,禁止转载。 本文对XLA源码分析所使用的TensorFlow代码库commit id为d813f80ded2fe1f8aa4e07ead2cb6fc16451b634(master分支), JAX代码库commit id为4dd1f001c626eb15f1a8deac58d97b578a1bd85c(main分支,且使用上述tf对应的commit id)。 ...

XLA编译执行原理分析

特别声明:未经授权,禁止转载。 本文所使用的TensorFlow代码库commit id为f270180a6caa8693f2b2888ac7e6b8e69c4feaa8(r2.1分支)。 XLA功能概览 tensorflow/compiler/aot AOT方式使用XLA,通过tfcompile命令实现1。 tensorflow...