My work and research focus on intelligent computing architecture for Cloud Computing and Artificial intelligence, including
•Software-hardware Co-design for Cloud Infrastructure
•Next-generation DPU(Data Processing Units)
•CPU Microarchitecture
•Computer System Test and Reliability
•Performance Evaluation and Tuning
2006.1 ~ 2016.6 华为技术有限公司
2016.6 ~ 阿里巴巴(花名:正一)
Publications:
Paper
1. NVMePass: A Lightweight, High-performance and Scalable NVMe Virtualization Architecture with I/O Queues Passthrough, Yiquan Chen , Zhen Jin, Yijing Wang, Yi Chen, Jiexiong Xu, Hao Yu, Jinlong Chen, Wenhai Lin, Kanghua Fang, Keyao Zhang, Chengkun Wei, Qiang Liu, Yuan Xie, Wenzhi Chen,2025 The 31th IEEE International Symposium on High-Performance Computer Architecture (HPCA)
2. Performance Characterization of SmartNIC NVMe-over-Fabrics Target Offloading, Jiexiong Xu, Yue Qiu, Yiquan Chen, Yijing Wang, Wenhai Lin, Yiquan Lin, Shushu Zhao, Yuqi Liu, Ying Wang, Wenzhi Chen, Systor 2024
3. PARS: A Pattern-Aware Spatial Data Prefetcher Supporting Multiple Region Sizes, Yiquan Lin, Wenhai Lin, Jiexiong Xu, Yiquan Chen, Zhen Jin, Jingchang Qin, Jiahao He, Shishun Cai, Yuzhong Zhang, Zonghui Wang, Wenzhi Chen, TCAD 2024
4. Optimizing NVMe Storage for Large-scale Deployment: Key Technologies and Strategies in Alibaba Cloud, Yiquan Chen, Yijing Wang, Jiexiong Xu, Zhen Jin,Anyu Li, Xiaoyan Fu, Qiang Liu, Wenzhi Chen, IEEE Micro 2024, Volume 44, Issue 5
5. BlueJay: A Platform to Quantifying the Impact of Memory Latency on Datacenter Applications Performance, Jingchang Qin, Yiquan Chen, Shishun Cai, Wenhai Lin, Jiexiong Xu, Zhen Jin, Lifa Cao, Zijie Zheng, Yuzhong Zhang, Yi Chen, Wenzhi Chen, 2024 The 24rd IEEE/ACM International Symposium on Cluster, Cloud and Internet Computing (CCGrid)
6. CINDA: Don’t Ignore Instructions When Cloning Memory Access Behavior, Wenhai Lin, Yiquan Chen, Zhen Jin, Jiexiong Xu, Peiyu Liu, Shishun Cai, Yuzhong Zhang, Jingchang Qin, Yiquan Lin, Wenzhi Chen, 2024 The 24rd IEEE/ACM International Symposium on Cluster, Cloud and Internet Computing (CCGrid)
7. LightPool: A NVMe-oF-based High-performance and Lightweight Storage Pool Architecture for Cloud-Native Distributed Database, Jiexiong Xu, Yiquan Chen, Yijing Wang, Wenhui Shi, Guoju Fang, Yi Chen, Huasheng Liao, Yang Wang, Hai Lin, Zhen Jin, Qiang Liu, Wenzhi Chen, 2024 The 30th IEEE International Symposium on High-Performance Computer Architecture (HPCA)
8. JACO: JAva Code Layout Optimizer Enabling Continuous Optimization without Pausing Application Services, Wenhai Lin, Jingchang Qin, Yiquan Chen, Zhen Jin, Jiexiong Xu, Yuzhong Zhang, Shishun Cai, Lirong Fu, Yi Chen, Wenzhi Chen, 2023 IEEE International Conference on Cluster Computing (CLUSTER)
9. HyQ: Hybrid I/O Queue Architecture for NVMe over Fabrics to Enable High-Performance Hardware Offloading, Yiquan Chen, Jinlong Chen, Yijing Wang, Yi Chen, Zhen Jin, Jiexiong Xu, Guoju Fang, Wenhai Lin, Chengkun Wei, Wenzhi Chen, 2023 The 23rd IEEE/ACM International Symposium on Cluster, Cloud and Internet Computing (CCGrid)
10. BM-Store: A Transparent and High-performance Local Storage Architecture for Bare-metal Clouds Enabling Large-scale Deployment, Yiquan Chen, Jiexiong Xu, Chengkun Wei, Yijing Wang, Xin Yuan, Yangming Zhang, Xulin Yu, Yi Chen, Zeke Wang, Shuibing He, Wenzhi Chen, 2023 The 29th IEEE International Symposium on High-Performance Computer Architecture (HPCA)
11. On Workload-Aware DRAM Failure Prediction in Large-Scale Data Centers, Xingyi Wang, Yu Li, Yiquan Chen, Shiwen Wang, Yin Du, Cheng He, YuZhong Zhang, Pinan Chen, Xin Li, Wenjun Song, Qiang xu, Li Jiang, 2021 IEEE 39th VLSI Test Symposium (VTS)
12. System-level hardware failure prediction using deep learning, Xiaoyi Sun, Krishnendu Chakrabarty, Ruirui Huang, Yiquan Chen, Bing Zhao, Hai Cao, Yinhe Han, Xiaoyao Liang, Li Jiang, 2019 56th ACM/IEEE Design Automation Conference (DAC)
Patent
1. Data storage method, device and system, 陈义全, PCT/CN2015/081359, CN104461935A
2. Data transmission method, system and electronic equipment, 陈义全、王一静、靳珍、付晓燕, CN116662223A
3. Method, storage device, and data processing system for implementing virtualization of storage device, 陈义全、王一静、靳珍、付晓燕、陈文智, CN117111835A
4、一种不中断应用服务的Java代码布局优化方法, 陈文智、林文海、陈义全、覃竞畅、蔡世顺、张羽中, CN117270822A
5、一种量化内存延时对数据中心应用程序性能影响的方法, 陈文智、覃竞畅、陈义全、蔡世顺、曹理发、郑子杰、张羽中, CN117271115A
6、内存器的压力控制方法及其相关设备, 蔡世顺、陈义全、唐军、郑浪, CN117194121A
7、Transmission method, server, equipment, bare metal example and substrate management controller, 赵澍澍、陈义全、王一静、徐杰雄, CN115080479A
8、基于积分算法的云网络资源弹性调度方法及系统, 陈文智、魏成坤、陈义全、徐天宇、蒋骁翀、张紫徽、祝顺民、李星、陈子康、杨博文,CN114675972A
9、FPGA hardware design capability evaluation system and method for cloud environment, 陈文智、魏成坤、施青松、刘剑文、王淼、陈义全、张紫徽, CN114661614A
10、FPGA hardware construction language implementation system based on C++, 陈文智、魏成坤、施青松、王淼、刘剑文、陈义全, CN114756219A
11、Cloud network session connectivity guarantee method and system for virtual machine live migration scene, 陈文智、魏成坤、陈义全、蒋骁翀、徐天宇、张紫徽、祝顺民、李星、陈子康、胡宝海, CN114679461A
12、时延可预测的NVMe存储虚拟化方法和系统, 姚建国、郭成、彭博、陈义全、王一静,CN112667356A
13、信息处理系统、信息处理方法及设备, 于浩、曹理发、虞旭林、陈义全, CN112785788A
14、DPU-based server installation system and method, 陈文智、王佳宁、陈义全、王一静、赵澍澍, CN118276883A
Book
1、高山渊、蔡德忠、赵晓雪、刘礼寅、刘水旺、陈义全、徐波 ,《企业数字化基石 – 阿里巴巴云计算基础设施实践 》, 电子工业出版社,2020-01-01
能否再提供一些关于flashcache的资料?
工作事情比较多,有空整理一下FlashCache实现原理及源码分析,完成后共享。
我做了优盘操作系统后,装系统的时候出现了和您曾经给我装的那个一样的问题,就是装系统的时候,会突然弹出,Try again to mount the CD-ROM 这个问题您后来解决了 请问怎么处理啊?
期待您的邮件
谢谢。
全总,啥时候出一本kernel的书?
i love it
评论需要翻qiang才能用。
不会吧。我回复,不需要翻墙啊。
就是来点个赞,楼主的文章写得真好
感谢肯定,请以后多指教、交流。
我是来点赞的!:)
感谢博主的无私分享,帮助我在服务器的相关问题上指引前行~
同时恳请前辈再给点职业道路上的指点:我目前也是在服务器行业,已工作2年多,公司是ODM台资厂商,做的是服务器的外围监控软件部分,芯片是MCU。时不时的再捣鼓下系统上的问题。台资厂商压力小,待遇也低,生活压力较大,时不时的迷茫自己的竞争优势在哪里,Server行业属于夕阳行业么?如果跳槽,是服务器行业还是往其他行业跳?恳请前辈不吝指点!
1、工作前期,能力积累最重要,待遇不必太在意。能力包括技术、沟通能力、思维能力、领导力、项目经验。
2、你做软件的,未来工作方向不必局限于服务器。软件是相通的,做硬件也是如此。你现在做服务器,以后可以做存储、甚至可以做手机软件。看你自己的兴趣点和努力方向。
好的,十分感谢!
前辈, 有没有什么学习链接和资料可以贴在您的主页上面呢。
你希望贴哪些资料?
打开网页比较慢,经常看到任务栏提示 等待 fonts.googleapis …
由于国内访问不了google,可否将网页优化下,不去调用googleapi。等有朝一日google可以访问了再用。
谢谢。我设置一下。
内容非常好,但是打开网页非常慢,看到任务栏提示 等待 fonts.googleapis.com。
由于国内访问不了google,在公司办公,也没有办法使用其它的代理进行连接。可否将网页优化下,不去调用googleapi。等有朝一日google回来了咱再用。
你写的关于文件系统,IO和相关的文章很详细。节省了我很多时间去看这一部分。
我主要是在车载嵌入式平台工作的。对文件系统这一块比较在意,自己也在不断深入。您是前辈,以后多多交流啊。
以后多交流。
阅读了您的Linux内核IO部分的文章,感觉受益匪浅。上个月才签了华为成研所明年才入职,感觉要进前辈奋斗过的地方了呢。。。额,我有一个小白的问题,就是关于截获块设备的读写,除了在通用块设备层截获其Bio,能不能在IO调度层直接截获request呢?
可以在I/O调度层截获request。
向大神学习, 纯粹来感谢.
传道授业解惑以及无私
我在看IO相关的文章看前辈有提到《Linux块设备驱动》这篇,怎么没找到。
这篇文档还没整理。可以参考网上很多文章。
好的,支持关注中。。。。
一 最近在学习cpu 时间计算的相关知识, 有几个疑问想请教下。
1 您说%us=(User time + nice time)/CPU时间*100% ,
这句话有2种理解:
1.1 cpu消耗在user空间的百分比,是这样计算。
1.2 像top这样的工具,在统计的时候,是按照这个公式去计算并且显示的。
我觉得1.2 这样明显不可能, 因为在网上搜到这样的截图:参考http://blog.csdn.net/wangxin6722513/article/details/43452075
%us 比较低,但是%ni有比较高的情况。因此top命令,绝对没有按照“%us=(User time + nice time)/CPU时间*100%”这样的公式去计算,然后显示给用户看。
所以我猜您想表达的意思是: CPU消耗在user 空间的时间占比,是按照“%us=(User time + nice time)/CPU时间*100%”这个公式去计算的。想确认下理解是否正确。
二 关于cpu消耗时间:
user \nice \system\idle\iowait\irq\softirq\steal\guest\guest_nice
的含义我能够搞懂,
(根据这篇文章https://github.com/Leo-G/DevopsWiki/wiki/How-Linux-CPU-Usage-Time-and-Percentage-is-calculated#overview)
1 但是它们之间的关系,是如何的?(他们理论上的关系是如何的,比如user列的数值,有没有包含nice列的数值?)
2 另外/proc/stat文件下面的几列数字,关系又是如何的?
2 为何我的机器上(CentOS 6.8)只有9列,没有10列
三 关于几个数值,作为新时代SRE工程师,如何去调优?
User time高: 应该是剧情发展的正确方向
Nice time高: 应该如何去定位问题?
IO wait高: 应该往Linux IO子系统去深挖
System高: 应该如何去定位问题?
请教下以上几个问题,盼回复,感谢。
大三的时候就收藏了博主的博客,三年过去了,故地重游😄内核大神
感谢持续关注。现在在读研?
嘿嘿,工作了:)
我还记得当时给你发邮件问linux 内存的问题了,然后因为当时翻墙不方便你回了信我都没看到,万分抱歉啊
刚毕业的时候因为喜欢操作系统+C语言但是因为不想做嵌入式并且其实大部分公司的内核开发也不会找没经验没实习的毕业生嘛,所以就去做了后台开发,包括现在也一直是:),前辈是榜样,加油
大神,评论一直显示Your comment is awaiting moderation????貌似不能评论
看了您的文章收获了很多东西,谢谢你!!!
请问一下您是怎么把 source insight 里面高亮的代码放到pdf的呢?我 Google 了这个问题,但是没有找到好的方法,所以只能在这里请教您了。
1、用Source Insight打开文件后,File->Print;
2、在 常规->选择打印机中,选择“Adobe PDF”;
3、点确定,输出一个pdf文件了,然后去pdf文件里面复制代码,粘贴到word里面。
大神很666
大神,我是一个刚工作不到一年的菜鸟,做的主要是存储相关的,涉及内核和分布式,您是内核大神,想问下您对于内核方面的职业规划,还有内核是否也会像其他很多方向一样到30多岁出现职业危机?
存储和Linux内核方向,不存在30多岁职业危机。不管哪个行业,持续学习、进步、思考,才是最重要的。
请问楼主,平时是怎么学习的,如何获取知识,培养学习能力,积累知识点,有什么好的学习书籍、网站平台、方法吗?
1、带着问题去看书,效果最好。如果没有实际工作中的问题,那么就要多问自己为什么。
2、多用Google搜索,多动手实践。
3、有个学习主线,如系统启动过程及硬件初始化过程、IO读写完整流程等。知识是点滴积累,积少成多、从点到面、从面到系统;基本上很难有一个网站或者数据能涵盖你所有的知识。
今天搜triple fault的问题找到了这里,发现居然还是菊长10年的前辈,10年老兵居然还奋斗在一线,厉害,佩服
内存映射看到这里的,感谢!
膜拜大牛
我目前研二,目前研究方向是内核方向。自己在学习源码的过程中有不少疑惑,网上和书籍中能查阅的资料也比较少,有不少问题只能先记下来,以后遇到了再回过头来解决,效率并不是很高。
这段时间在看VFS文件读写,页面cache一直没有很懂,无意间搜到博主的文章,看完之后解决了很多我之前遗留的疑惑,帮助很大。
我自己也写博客,希望自己的博客也能在以后像博主今天帮到我一样,为其他人解决问题就好了。
最后感谢博主近十年来的无私分享,实为我辈之楷模。
感谢肯定,以后多交流。
你现在在哪个学校读研?
大神好,看过你的《Linux内核写文件过程 》。select、poll系统调用的时候会去调用file的poll方法,poll方法会调用poll_wait方法,我想看一下poll方法的实现,发现ext4没有实现,请教下,它的实现在哪一层?
file的poll方法,一定会把一个wait_queue_head_t给poll_wait,然后在write等方法中wakeup这个wait_queue_head_t上的wait_queue_t,我读了你的《Linux内核写文件过程 》,也找不到wakeup这个点。只是猜测它在vfs_write方法的‘fsnotify_modify(file);’这一句里,但是又想了下fsnotify是linux另外一套通知机制,应该不会在此方法处。能抽空帮忙捋一下吗?
感谢楼主的多年来的分享付出!偶然间看到楼主多年前画的存储IO栈,于是看了看楼主的文章,感觉很受用,先收藏了,以后不定期看看有没有更新。
我现在研一,研究方向就是存储,内核这方面。目前刚刚接触这方面,感觉这个方向不像某些火得一塌糊涂的方向(如AI,前后端),没有比较系统的资料,一般都比较零散,同时也经常牵涉到其他部分知识。
最近我准备开一个博客用来记录下自己的学习过程,同时也希望像楼主一般帮助后来人。
希望未来有机会能和楼主多交流。
感谢楼主的多年来的分享付出!偶然间看到楼主多年前画的存储IO栈,于是看了看楼主的文章,感觉很受用,先收藏了,以后有空多来看看有没有更新。
我现在研一,研究方向就是存储,内核这方面。目前刚刚接触这方面,感觉这个方向不像某些火得一塌糊涂的方向(如AI,前后端),没有比较系统的资料,一般都比较零散,同时也经常牵涉到其他部分知识。
最近我准备开一个博客用来记录下自己的学习过程,同时也希望像楼主一般帮助后来人。
希望未来有机会能和楼主多交流。
为你选择存储、内核方向点赞!欢迎多交流。
Stay Hungry Stay Foolish