作为UEFI/BIOS圈的业内人士,我十分惊讶的看到,UEFI和传统BIOS的概念在很大程度上还是模糊不清的。甚至很多硬件圈资深知友也让我来介绍一下。我刚好借此此题来系统总结UEFI和BIOS的区别,和未来PC启动固件的走向。
出乎很多人意料的是,UEFI和传统BIOS在启动引导过程原理上没有本质区别!为什么这么说呢?那为什么还要发明UEFI?UEFI将要向何处去?这些问题如同人类宗教起源的灵魂三问“我是谁,从哪里来,将向哪里去一样“,会将看问题的深度提高到另一个层次。幸运的是,这些问题相对灵魂三问来讲,有确定的答案,今天我就带大家一起来探索一下。如果对这些问题不感兴趣的同学,读到这里也就可以结束了。
UEFI和BIOS启动过程有什么不同吗?有些同学说起UEFI和传统的BIOS区别,会如数家珍般的罗列MBR、PEI、DXE、UEFI分区啊这些东西,实际上这些全部是软件层面的抽象,本身并没有奇特的东西。传统BIOS也可以做出改变支持PEI/DXE和UEFI分区等等,UEFI固件也可以支持支持传统BIOS的环境,两者并没有功能上本质的区别。
实际上PC的电脑 启动固件的引导流程从IBM PC机诞生第一天起,就没有本质改变过。如果我们透过SEC、PEI、DXE和BDS等等复杂的术语看幕后隐藏的本质,就会发现无论传统BIOS还是UEFI,阳光之下没有什么新鲜的东西,启动本身无外乎三个步骤:
1.Rom Stage:在这个阶段没有内存,需要在ROM上运行代码。这时因为没有内存,没有C语言运行需要的栈空间,开始往往是汇编语言,直接在ROM空间上运行。在找到个临时空间(Cache空间用作RAM,Cache As Ram, CAR)后,C语言终于可以登场了,后期用C语言初始化内存和为这个目的需要做的一切服务。
2. Ram Stage: 在经过 ROM阶段的困难情况后,我们终于有了可以大展拳脚的内存,很多额外需要大内存的东西可以开始运行了。在这时我们开始进行初始化芯片组、CPU、主板模块等等核心过程。
3. Find something to boot Stage: 终于要进入正题了,需要启动,我们找到启动设备。就要枚举设备,发现启动设备,并把启动设备之前需要依赖的节点统统打通。然后开始移交工作,Windows或者Linux的时代开始。
这就是传统BIOS和UEFI的启动过程,在剥去了术语后,主干的三个步骤从来没有变化过。熟悉嵌入式系统开发的同学会发现,大多数嵌入式系统启动也大致是这些个步骤,从某种意义上讲,PC启动过程并没有什么特殊的。
传统BIOS尽管开始全部用汇编语言完成,但后期也部分引入了C语言,这些步骤完全是一样的。什么MBR分区啊,UEFI分区都是枝节问题,都是技术上可以做到的,没有什么是UEFI可以做,传统BIOS不可以做到的。那么问题来了,为什么UEFI会替代传统BIOS,UEFI展现了什么独特的魅力吗?要理解这一点,我们先要看看PC启动固件到底问什么必须。
为什么需要BIOS和UEFI?与大多数人基电脑本的概念不同,在某种意义上来说,X86体系比ARM体系更加开放。X86是很多小伙伴一起玩,以生态圈的概念提供产品,并对自己那部分负责;而ARM体系虽然也依赖生态圈,但最终有个大Boss统合整个生态链,提供最后产品并对该产品负总责。
X86生态圈玩家众多,有OS 厂商(OSV)定期发布操作系统,如Windows,Ubuntu;芯片厂商提供CPU,如Intel, AMD;主板厂商(OEM)提供电脑主板;独立硬件供应商(IHV)生产扩展板卡如显卡等等PCIE扩展卡,再如内存厂家推出一代一代不同的内存条等等。
DIY玩家可以自由选择搭配合适/兼容的产品搭配出自己心仪的机器,休闲上网用户花2000多元就可以搭配出一套可用的电脑,而游戏玩家则可能花费上万元才能满足游戏配置需求。还有些品牌机厂商如Dell和联想等,他们提供整套最终产品给用户。但他们实际上是在所有小伙伴的零件基础上拼凑出个产品,技术不强,话语权弱,并不能统一整个产业链。用户津津乐道的反而是用的什么CPU,安装的什么操作系统,用的那种显卡等等。Windows死机、蓝屏和缓慢等等时候,用户往往会抱怨微软和Intel,而不是品牌厂商。
ARM体系由最后品牌厂商统合整个产品,它负责打通整个产业链,并对其中所有部分负责,话语权极强,同时对技术也相对较强。用户面对的具体品牌的产品,而不是碎片化的各个部分。强势的如Apple,硬件软件一起抓,完全组成闭环的链条。稍差也如华为等安卓手机,要负责安卓系统在自己手机移植部分(BSP),客户出了问题并不会找谷歌,而会去找华为。
在X86生态圈十分强势的微软,自己负责操作系统开发,跳过品牌直接服务最终用户,甚至不经允许直接升级操作系统,闹出不少风波。强势也带来了副作用,它要直接面对数千数万种千奇百怪的硬件产品,如何才能用一个软件安装包服务于这么多种设备呢?必须要一个软件抽象层封装这些硬件差别!
这就引出了BIOS和UEFI的最主要的功能:初始化硬件和提供硬件的软件抽象。
ARM体系也要初始化具体主板相关硬件如GPIO和内存等,这些一般在BSP中完成。与X86体系不同之处在于这些硬件完全定制化,初始化的时候就预先知道有哪些设备,Solder Down了哪个品牌的哪种内存颗粒,到时候就照方抓药,初始化一大堆寄存器而已。X86系统配置情况在开机时候是不知道的,需要探测(Probe)、Training(内存和PCIe)和枚举(PCIe等等即插即用设备),相对较复杂。BIOS和UEFI提供了整个主板、包括主板上外插的设备的软件抽象。通过探测、Training和枚举,BIOS就有了系统所有硬件的信息。它通过几组详细定义好的接口,把这些信息抽象后传递给操作系统,这些信息包括SMBIOS(专栏稍后介绍)、ACPI表(ACPI与UEFI),内存映射表(E820或者UEFI运行时)等等。通过这层映射,才能做到做到操作系统完全不改而能够适配到所有机型和硬件。在某种程度上来讲,BIOS和UEFI是将操作系统BSP部分单独封装后下放到主板或者BIOS提供商来完成。这在过去带来了巨大的好处,WinXP、Win7现在还可以运行在更新的电脑硬件上,新的硬件只要自己更改一下就行了,兼容性是ARM体系所不能比拟的。当然割裂的生态圈也带来了用户感受的千差万别,这也受到广泛诟病。各自为政也窒息了创新,带来了同质化。为此,Intel越俎代庖,提出了变形本等等概念;而微软更直接出了Surface,似乎要与过去的小伙伴争食。其实这些都是不得已而为之,今后的发展还需要拭目以待。
arm社区最近为了进入x86的传统优势领域,也开始接受uefi,不过一般只在服务器领域。个别厂商为了支持Windows而在平板等设备支持uefi,某厂商在手机上也要引入uefi。不过这些只是支流,并且他们并不吧自己叫做BIOS,而叫做Bootloader。
UEFI带来的独特价值看过我的UEFI历史的文章,就知道UEFI是为了替代传统BIOS而诞生。这里说个小插曲,很多同学都奇怪专栏为什么有时候说BIOS是指传统BIOS,有时似乎又涵盖UEFI。实际上,业内人士在UEFI诞生之初,会严格区分两者的区别,如果十几年之前有人问我是不是做BIOS的,我会认真的否定:“不,我是做UEFI的,thank you very much!”
如果有人说UEFI BIOS,会被人蔑视:“BIOS就是BIOS,UEFI就是UEFI,怎么能混为一谈呢?”但在现在UEFI已经全面取代传统BIOS,传统BIOS已经几乎绝迹的情况下,业内人士已经放弃吃药,默认BIOS就是指UEFI。现在如果有人在我说出UEFI来露出痴呆的表情时,我会说:“就是BIOS啦,哈哈哈”
传统之强大可见一斑。甚至现在的招聘JD还是说要找“BIOS工程师”。
人们总是习惯性的对新出现的东西持怀疑和否定的态度,UEFI在启动时又还是那三个步骤,那么UEFI一定是提供了某种特别的东西,才能让传统的固件工程师改换门庭。它们究竟是什么呢?
答案就隐藏在上面一节“BIOS、UEFI的目的”中。UEFI扫除了传统BIOS割裂的生态,打通了PC固件之间的鸿沟,并提供统一的接口给操作系统,而不关心操作系统是什么;它能够更好的完成PC固件的终极目的:初始化硬件和提供硬件的软件抽象,和启动操作系统。如果说有什么东西帮助UEFI打败了传统BIOS,那这些东西就是:标准接口、开放统一和开源了。
传统BIOS来自于IBM,之后就进入战国时代,激烈的商战让接口统一成为了不可能做到的事,只有在面对微软这个大用户的时候,才勉强提供了“兼容”的基于软中断的接口。它封闭、神秘和充满各种不清不楚的预设和祖传代码,在调试PCI的ROM时要小心各种rom之间互相踩,各种只有老师傅才知道的神奇“诀窍”。要写个驱动,让它在各个BIOS厂商那里都能跑,简直成为了一件不可能完成的任务。
UEFI 由Intel推动,在一开始就将标准公开,拉上了微软这个PC界的霸主,强势统一了江湖。在近20年的深耕下,统一了固件启动阶段基础框架Spec:PI Spec与操作系统的接口Spec:UEFI Spec,并将抽象硬件的原语性Spec: ACPI Spec也拉入这个大家庭,都变成UEFI Forum的一份子。
现在只要符合UEFI driver model的驱动都可以在各个BIOS上运行,打通了各个BIOS厂商之间的栅栏;与此同时,符合UEFI标准的操作系统都可以流畅的在各种主板上运行,无论是Windows,还是Linux各种发行版,甚至是Android。实际上,PC生态圈的繁荣,和UEFI的推广和被广泛接受是分不开的。
值得一提的是UEFI内核的大部分代码是由Intel的中国工程师开发的。在大家一次次电脑的正常运行后面,有他们辛勤工作背影。他们也为固件的开源和国产化做出了自己的贡献。代码已经全部开源一段时间了,在GitHub 。
芯片公司的角色有些朋友读到这里,应该会有一个疑问:BIOS的标准,不是应该由BIOS供应商(IBV)来主导吗?为什么Intel会越俎代庖呢?Intel和AMD在BIOS产业链中到底扮演什么角色?
人们常说,二流的企业做技术,一流的企业做标准。尽管如此,标准的制定、维护和推动需要大量的人力和金钱。标准出来了,推广它的企业却破产的示例比比皆是。Intel愿意提出标准、实现它并不遗余力的推动它,是有现实利益考量的。
哪个公司雇用了最多的BIOS开发人员?不是AMI,而是Intel。Intel雇佣了这么多开发人员,但市面上却没有Intel牌子的主板(曾经有,现在服务器也有),是为什么呢,他们在干什么呢?
BIOS对于AMI和各种OEM厂商来说,是主板固件,是产品不可或缺的一个部分。但对Intel和AMD来说,却更加重要。BIOS和它们的核心商业:卖芯片,息息相关。BIOS和芯片制造,验证和使用,有千丝万缕的关系。BIOS是Silicon Enabling的最重要部分。
定义:何谓芯片使能化?英文原词为silicon enabling,硅使能?如何理解呢?其实不复杂,首先强调一点,公司的存在当然是为了盈利的。又有个比方说,假如你买了一堆积木,先想了下要搭个什么东西,然后你就通过各种方法把他搭成了你预想的样子。芯片(Silicon)制造商做的事情其实差不多,首先,他要购入硅,塑料,各种金属(买积木),通过技术把这些东西有机组合在一起,使其“变废为宝“(按自己想法搭建),变成了具有各种用途的芯片,并可以证明它好用,可以做成最终卖给客户的产品或其中一部分。这个过程中所有需要的必要部分,可以看作Enable(使能)了这个产品,使芯片可制造,可验证,可使用。所有叫做Silicon Enabling。
BIOS在芯片公司里会深入整个产品周期。在制造之前的Pre-silicon阶段,帮助RTL验证逻辑正确性,避免Tape in后有不可修正的错误,减少Tape in次数;在Tape In之后,帮助Power On芯片,验证各种特性(features)正确工作与否,并在硬件有问题之后,尽可能的通过软件打补丁(workaround)的方式而不是重新Tape in的方式修正错误;最后在产品上市之前,提供参考代码(reference code)给OEM,帮助它们专注于自己真正的产品,也就是主板和整机上,而不须操心芯片如何正确工作。
可以看出,好的BIOS架构和强大的BIOS团队,可以确实地帮助芯片公司节省成本:减少Tape In次数。多次Tape In, stepping越多,成本越大。于此同时,更多次Tape in会让芯片延期上市,上市窗口丢失,可能让整个产品变得没有商业价值,这个损失就更不可以衡量了。另一方面,BIOS也可以让芯片更好地按照设计需求工作,是产业链条中的前端。这也就是芯片公司为什么会这么在意BIOS,为什么会在没有在BIOS上赚到任何钱的情况下,还会无怨无悔的贡献代码,领导BIOS前进的原因。
UEFI将要向何处去?开放的生态,离散的玩家召唤出UEFI代替了传统BIOS。在发展近20年之后,UEFI的代码量十分庞大。在Github上有数百万行!简直和一个操作系统一样,提供各种各样的驱动和lib,包括网络驱动、iscsi这样的大块头,蓝牙和WiFi这些小众驱动。多样的驱动和Lib,提供了极大的灵活性,用户可以拼接出强大的BIOS程序,但与此同时,这些庞大的代码,各种Lib和driver,让理解它十分困难。看准了这个机会,以前偏居一隅的Coreboot在跃跃欲试,走出了ChromeOS的疆域,在IoT市场上开始发力,并希望染指服务器领域。Google又提出LinuxBoot,希望在这个领域能分一杯羹。
简单就是美,如何简化它,如何更好地和开源社区一起愉快的玩耍,是UEFI需要解决的问题。20年之后的现在,UEFI已经变得越来越传统,曾经的屠龙骑士变成了恶龙,业界呼唤新的方案,Intel也不失时机的提出了ModernFW 电脑的概念。
在这个变化的时代,挑战趋势就意味着被淘汰,就如以前BIOS的霸主Phoenix一样,作为行业一哥,拒绝变化,终被AMI超越。个人更是要顺势而为,才能事半功倍。未来在哪里,现在就下断言为时尚早,但可以预言的是,未来的PC启动固件,一定会更小,更美,更简单!
电脑