搜索
您的当前位置:首页正文

LLVM-Clang 学习笔记

来源:二三娱乐

1.先来看看什么是 LLVM?

LLVM 是 Low Level Virutal Machine的简称,它是个编译器框架,用于优化以任意程序语言编写的程序的编译时间(compile-time)、链接时间(link-time)、运行时间(run-time)以及空闲时间(idle-time).在2000年, Chris Lattner开发了这一套编译器工具库套件.后来随着 LLVM的发展,LLVM可以用于常规编译器,JIT编译器,汇编器,调试器,静态分析工具等一系列跟编程语言相关的工作。

Chris Lattner:
熟悉 Swift 的开发者肯定知道这位大神的名字,他于2010年开始编写 Swift 语言,而且一个人实现了 Swift 的大部分基础架构.他也是 LVVM 以及 Clang的主要开发者.

2.GCC -> LLVM

GCC是 Xcode早期使用的一个强大的编译器.这个编译器被移植到各种系统中,其中就是 Mac OSX 操作系统,所以这就反映在 Xcode中,在早期的 Xcode 调试代码的一个工具就是 GDB,它是GNU调试器.

why换成LLVM呢?

版本 | 编译器版本
----|------|----
Xcode3之前 | GCC
Xcode3 | GCC与 LLVM混合编译器
Xcode4 | LLVM-GCC 成为默认编译器
Xcode4.2 | LLVM3.0成为默认编译器
Xcode5 | LLVM5.0, 完成 GCC到LLVM的过渡

3.LLVM 与 Clang

Clang是一个C、C++、OC语言的轻量级编译器。源代码发布于BSD协议下。Clang是由C++编写,基于LLVM,发布于LLVM BSD许可证下的编译器。它与GNU C语言规范几乎完全兼容,并增加了额外的特性。

如果说 LLVM是 iOS 的编译器是不太准确的,但说clang 是 iOS 的编译器这也不太准确,因为 clang 是编译器前端(下图中的 Frontend).那编译器又什么?

简单来说,编译器就是把我们的 C,C++,OC 代码转成 hard code, 在这个过程中,编译器会对代码做各种分析来保证没有无法编译的错误.

Three-Phase编译器架构

这里就要说一下LLVM的三层架构:

1.Frontend: 这第一层就是 clang, 它支持将多种输入语言(c family)经过一系列处理后生成汇编代码(LLVM JR).

Optimizer:这第二层是一个优化器,对 LLVM JR 做优化.

3.Backend:第三层对不同的平台再将汇编转成 machine code.

摘自孙源在 MDCC2016的 session

作为一个 iOS 开发者,个人在学习中主要关注在第一层,对第二层第三层只做了解(hello world level).
当按下 Xcode上Run这个按钮之后,我们的编译器做了什么呢?

1.预处理(Prepreocess): import, macro, 预处理指令...

2.词法分析:(Lexical Analysis):将预处理过的代码文本转化成Toke流

3.语法分析:(Semantic Analysis):验证语法是否正确,生成语意节点,组合成抽象语法树.(AST)

4.静态分析:(static Analysis):类型检查,找出非语法错误.

5.代码生成:(CodeGen-IR):生成 LLVM-JR(汇编)



TO DO:
1.clang插件的使用和研究;
2.lldb 调试器的深入学习;

参考文章:

Top