the 1st edition: 20120506
the 2nd edition: 20150918
the 3rd edition: 20221207
x86 32bit pc
本篇文章介紹在 pc 上寫所謂的「開機程式」, 這是在 legacy BIOS 的環境, UEFI 就不是這樣了。可能有點過時, 不過有些觀念還是可以在應用在其他平台, ex: arm。
uefi 的「開機程式」寫法請參考:
作業系統之前的程式有個很威的英文名詞 bare metal program, 什麼意思? 就是字面上的意思, 不另外解釋了。但它不見得是 pc 開機的第一隻程式, BIOS/UEFI 才是 pc 上開機時跑的的一支程式, 你可能覺得有些失落, 但沒辦法, 除非你打算寫 BIOS/UEFI。和你想像中的「開機程式」可能有些不同, 不過就算是 arm 平台的機器, 也有類似的東西, 通常會有一個 rom code 才是所謂的一開機執行的程式, 一般開發者是碰不到這塊的。
作業系統之前的程式 (1) - c++ 篇
作業系統之前的程式 (2) - c++ global object ctor/dtor can not be invoked
mosut 分享的主題。介紹一下在作業系統之前的程式 (僅僅印出個字串)。寫一個
作業系統之前的程式 就和在作業系統下很類似, 不過有幾點要注意。
bootloader hello world 被載入的位址是 0x7c00, 也就是從這裡開始執行。
510, 511 byte 必須是 0xaa, 0x55 結尾。
不能大於 512 byte, 其實扣掉 0x11, 0x55 2 byte, 只能有 510 byte。
沒有 printf 可以用, 得使用 bios call 或是寫入 video ram 來完成螢幕的輸出, 或是使用 com1 來輸出訊息。
可以使用組合語言, 還有大家很熟悉的 c/c++ 語言來寫這樣的練習程式, 其他可用的語言我就不知道了, 我只實作過這幾種語言。不過使用 toolchain 的方式和在作業系統下有點不同。也就是說, 程式的寫法是一樣的, 但是使用 compiler 產生執行檔的方式是不一樣的。而使用 C 語言只是展示用, 實際上一個 bootloader 要完成的事情可能無法使用 C 語言來完成, 因為很容易就超過 512 byte。
1 org 07c00h ; 告訴編譯器程序加載到 7c00 處
2 mov ax, cs
3 mov ds, ax
4 mov es, ax
5 call DispStr ; 使用顯示字元串例程
6 jmp $ ; 無限循環
7 DispStr:
8 mov ax, BootMessage
9 mov bp, ax ; ES:BP = 串位址
10 mov cx, 16 ; CX = 串長度
11 mov ax, 01301h ; AH = 13, AL = 01h
12 mov bx, 000ch ; 頁號為 0(BH = 0) 黑底紅字 (BL = 0Ch, 高亮)
13 mov dl, 0
14 int 10h ; 10h 號中斷
15 ret
16 BootMessage: db "Hello, NASM!"
17 times 510-($-$$) db 0 ; 填充剩下的空間,使生成的二進制程式碼恰好為 512 字節
18 dw 0xaa55 ; 結束標誌
bh.asm 是用 nasm 的 bootloader 程式 (from
Orange's 一個作業系統的實現 p 1-3), bh.asm 的組合語言是 intel 語法, 使用 nasm 產生 bootloader 的可執行檔很簡單。
nasm bh.asm -o bh.asm.bin
bh.asm L1 的註解不算精確, 應該是告訴 linker 這個程式需要計算的位址以 0x07c00 為基準去計算。把它載入 0x07c00 可以正常執行, 載入到其他位址可能會有問題。
bh.asm.bin 為 512 byte 的執行檔, 寫入軟碟第 1 個磁區即可。把軟碟放入開機後即可看到 Hello, NASM!
1 .code16
2 .text
3 .global begin
4 begin:
5 mov %cs,%ax
6 mov %ax,%ds
7 mov %ax,%es
8 movw $0xb800, %ax
9 movw %ax, %gs
12 mov $0, %edi /* Destination */
13 mov $msg, %esi /* Source */
15 1:
16 #cmp $0, %ecx
17 cmpb $0, (%esi)
18 jz 2f
19 movb %ds:(%esi), %al
20 inc %esi
21 movb %al, %gs:(%edi)
22 inc %edi
23 movb $0xc, %gs:(%edi)
24 inc %edi
25 dec %ecx
26 jmp 1b
27 2:
28 movb $'E', %gs:(160)
29 jmp .
30 #msg:.ascii "Hello GAS"
31 msg:
32 .asciz "Hello GAS"
33 #.asciz "Hello World"
34 .org 510
35 .word 0xaa55
bh.s 是使用 gas 來完成的 bootloader 程式, 範例的組合語言是 at & t 語法, 使用 gas 產生 bootloader 的可執行檔有點複雜, 除了程式碼本身, 還要一個 linker script, 在連結的時候使用。
hb.s L1 .code16 是告知 gcc 輸出 x86 16 bit 的組合語言, 應該很少人看過這個用法。
1 ENTRY(begin);
3 {
4 . = 0x7C00;
5 .text : AT(0x7C00)
6 {
7 _text = .;
8 *(.text);
9 _text_end = .;
10 }
11 .data :
12 {
13 _data = .;
14 *(.bss);
15 *(.bss*);
16 *(.data);
17 *(.rodata*);
18 *(COMMON)
19 _data_end = .;
20 }
21 /*
22 .sig : AT(0x7DFE)
23 {
24 SHORT(0xaa55);
25 }
26 */
27 /DISCARD/ :
28 {
29 *(.note*);
30 *(.iplt*);
31 *(.igot*);
32 *(.rel*);
33 *(.comment);
34 /* add any unwanted sections spewed out by your version of gcc and flags here */
35 }
36 }
產生 bootloader 執行檔的步驟為:
as -o bh.s.o bh.s
ld -Tas.ld -o bh.s.elf bh.s.o
objcopy -O binary bh.s.elf bh.s.bin
bh.s.bin 就是 bootloader 執行檔, 不像 nasm 那麼乾脆是吧! 你一定不喜歡, 不過這樣的學習負擔是有額外的收穫的。下面的 C 語言版本就需要這樣的作法。
1 __asm__(".code16gcc\n");
2 /*
3 * c bootloader
4 */
6 void main(const char *s);
8 int bbb=0; // test bss section
10 void WinMain(void)
11 {
12 main("hello world");
13 while(1);
14 }
16 void main(const char *s)
17 {
18 while(*s)
19 {
20 __asm__ __volatile__ ("int $0x10" : : "a"(0x0E00 | *s), "b"(7));
21 s++;
22 }
23 }
很像一般的 C 程式吧! 不過我們有著 windows 才有的 WinMain 和一般 C 的 main, 哪個才是程式開始的地方呢?仍然需要搭配的 linker script, 從以下的 linker script 可以看出, 我們的程式由 WinMain 開始。
1 /* for cb.c */
2 ENTRY(WinMain);
4 {
5 . = 0x7C00;
6 .text : AT(0x7C00)
7 {
8 _text = .;
9 *(.text);
10 _text_end = .;
11 }
12 .data :
13 {
14 _data = .;
15 *(.bss);
16 *(.bss*);
17 *(.data);
18 *(.rodata*);
19 *(COMMON)
20 _data_end = .;
21 }
22 .sig : AT(0x7DFE)
23 {
24 SHORT(0xaa55);
25 }
26 /DISCARD/ :
27 {
28 *(.note*);
29 *(.iplt*);
30 *(.igot*);
31 *(.rel*);
32 *(.comment);
33 /* add any unwanted sections spewed out by your version of gcc and flags here */
34 }
35 }
使用以下的步驟來產生 bootloader 執行檔:
gcc -fno-stack-protector -std=c99 -march=i686 -ffreestanding -Wall -c cb.c
ld -Tl.ld -nostdlib -o cb.elf cb.o
objcopy -R .pdr -R .comment -R.note -S -O binary cb.elf cb.bin
最前面提到的第一點: 載入的位址是 0x7c00, 這表示, 在程式裡變數的位址要從 0x7c00 來當作計算標準。nasm 使用 org 07c00h 來達成目的。而 gas 使用 linker script 來完成。C 版本也是一樣。
as.ld L4 . = 0x7C00; 就是告訴 ld 用 0x7c00 來計算位址, 而不是從 0 開始算起。
至於第二點: nasm 使用 bh.asm L17, 18 的方式來產生 0xaa55; gas 使用 bh.s L34, 35 的方法來產生 0xaa55; C 版本則使用 linker script 來產生 0xaa55, l.ld L21 ~ 24
0x7DFE 是 0x7C00 + 510 得到, 落在 512 最後的 2 byte, 從執行位址 0x7C00 開始算。
20120611 補充 C 語言篇:
模擬器畢竟是模擬器, 在真實的機器上測試果然就有問題了, 需要加入 L14 - L17, 將 %ds, %ss, %sp 設定好才行。
1 __asm__ (".code16gcc\n " );
2 /*
3 * c bootloader
4 */
6 //#define POINTER_TEST
8 void main (const char *s );
10 int bbb =0 ; // test bss section
12 void WinMain (void )
13 {
14 __asm__ ("mov %cs, %ax\n " );
15 __asm__ ("mov %ax, %ds\n " );
16 __asm__ ("mov %ax, %ss\n " );
17 __asm__ ("mov $0xff00, %sp\n " );
35 }
37 #ifndef POINTER_TEST
38 void main (const char *s )
39 {
40 while (*s )
41 {
42 __asm__ __volatile__ ("int $0x10" : : "a" (0x0E00 | *s ), "b" (7 ));
43 s ++;
44 }
45 }
46 #endif
20120726 補充:
身為 c++ 愛好者, 怎麼可以沒有 c++ 版本, 要不是因為 c++ runtime 實在太過複雜, 只好先屈就 c runtime, 我實際上很想用 c++ 來寫 os。
先來看看 c++ 版本, 不知道為什麼 g++ 一定會檢查 main() 的 prototype (加上 -ffreestanding 即可, 這樣 g++ 就不會檢查 main() prototype), 所以無法任意宣告 (一定要 int main(int argc, char** argv)), 我只好將 main 改成 print, 我不知道有無 option 可以關掉這種檢查。其他和 c 版本差不多。
12 extern "C" void WinMain (void )
c++ Mangling 的特性會把 function 重新改名, 使用 L:12 來避免這樣的情形, 因為 linker script 指定 WinMain 當進入點, 要不然自己改 linker script。
用了一個 c++ 的特性, function 的參數可以有預設值, 要不然就和 c 版本沒什麼差別了。
8 void print (const char *s , const char *msg ="\r \n g++ test" );
1 __asm__ (".code16gcc\n " );
8 void print (const char *s , const char *msg ="\r \n g++ test" );
12 extern "C" void WinMain (void )
13 {
14 __asm__ ("mov %cs, %ax\n " );
15 __asm__ ("mov %ax, %ds\n " );
16 __asm__ ("mov %ax, %ss\n " );
17 __asm__ ("mov $0xfff0, %sp\n " );
25 print ("hello cpp" );
36 while (1 );
37 }
40 void print (const char *s , const char *msg )
41 {
42 #if 1
43 while (*s )
44 {
45 __asm__ __volatile__ ("int $0x10" : : "a" (0x0E00 | *s ), "b" (7 ));
46 s ++;
47 }
48 #endif
49 #if 1
50 while (*msg )
51 {
52 __asm__ __volatile__ ("int $0x10" : : "a" (0x0E00 | *msg ), "b" (7 ));
53 msg ++;
54 }
55 #endif
56 }
使用以下的步驟來產生 bootloader 執行檔 (linker script 同 c 版本那個):
g++ -m32 -g -Wall -Wextra -Werror -nostdlib -fno-builtin -nostartfiles -nodefaultlibs -fno-exceptions -fno-rtti -fno-stack-protector -c cppb.cpp
ld -m elf_i386 -static -Tl.ld -nostdlib -M -o cppb.elf cppb.o >
objcopy -R .pdr -R .comment -R.note -S -O binary cppb.elf cppb.bin
git clone
cd simple_os
git checkout origin/cpp_bootloader -b cpp_bootloader
mosut 的分享, 也就是這篇文章的主題之一:
使用 GCC 和 GNU Binutils 编写能在 x86 实模式运行的 16 位代码
X86 Booting Sequence - X86 開機流程小
