olv: January 2009

這個系列是讀書筆記，作者可能沒有跟主題有關的開發經驗。

當一個程式被執行時，它的 stdin/stdout/stderr 會從父程序繼承。如果沒有特別指定，它們通常會指向同一個諸如 /dev/ttyX 或 /dev/pts/X 的 TTY device。很難不去好奇，當我們 getchar() 或 printf() 時，對一個 TTY device 的 I/O，在 kernel 裡頭會發生什麼事？

口語裡的 console，指的通常是圖中 VT。VT 是 virtual terminal 的縮寫，對 userspace 來說，它就像是一部真實存在著的終端機；在 kernel 裡頭，VT（的功能之一）是一個 TTY driver，它是所有 /dev/ttyX 裝置的驅動程式。對 TTY device 的 I/O 動作，會經由 TTY core 送給 TTY driver。資料往來於 TTY 與 TTY driver 的過程中，或者說圖中連結 TTY 與 VT 的線，被稱做 TTY ldisc，TTY line discipline。

在之前的文章中我們看到鍵盤向 TTY 送出的資料。來自於鍵盤的輸入，可能是特別的按鍵組合，目的並不是讓 userspace 去取得這些輸入。例如，我們會敲下 Ctrl-C 來中斷目前的程式；Ctrl-Z 來暫停目前的程式。又或者，我們不希望輸入的密碼會出現在螢幕上。這些需求都在 line discipline 中被滿足。因為所有的 I/O 都會經由 line discipline，於是它可以在使用者輸入特定字元時，對目前的程式送出 SIGINT 或 SIGTSTP；它也可以選擇是否要把使用者的輸入再 echo 回 VT。從這邊也可以看到，line discipline 不只可以對資料做緩衝與處理，它還被允計針對特定的輸入做特定的行為。當我們從 VT 換到實體的 COM port 時，且當與 COM port 連結的裝置不是終端機，而是數據機時，line discipline 甚至可以拒絕所有來自 userspace 的 I/O，轉而從 PPP network device 與 userspace 做資料交換。實際上，TTY device 只是一個 transport layer，可以跟它連結的裝置千變萬化。line discipline 於是也被設計成可以抽換；當從終端機換成數據機時，line discipline 也從 N_TTY 換成 N_PPP。

跟來自鍵盤的輸入一樣，使用者對 TTY device 寫入的資料，會經過 line discipline，VT，再進入螢幕。在 drivers/char/n_tty.c 的 do_output_char 函數中

switch (c) {
...
case '\r':
 if (O_ONOCR(tty) && tty->column == 0)
  return 0;
 if (O_OCRNL(tty)) {
  c = '\n';
  if (O_ONLRET(tty))
   tty->canon_column = tty->column = 0;
  break;
 }
 tty->canon_column = tty->column = 0;
 break;
case '\t':
 spaces = 8 - (tty->column & 7);
 if (O_TABDLY(tty) == XTABS) {
  if (space <>column += spaces;
  tty->ops->write(tty, "        ", spaces);
  return spaces;
 }
 tty->column += spaces;
 break;
...
}

可以看到 line discipline 會對特殊字元，像是換行符號或 tab 等做排版。更多關於 N_TTY 這個 line discipline 的功能可以參考 stty(1)。

VT 的架構與實體的 terminal 與 host computer 架構是對應的。要把現在手上正在上網的電腦想像成它是 terminal 與 host computer 的組成可能不是那麼容易。一個相對常見、具體的情境，是用一條線把手上的電腦與 wifi router 或手機的 UART console 連結。上圖中的 Computer B 可以理解成手上的電腦，Computer A 則是跑著 linux 的嵌入式系統。

這個系列是讀書筆記，作者可能沒有跟主題有關的開發經驗。

按下或放開按鍵的時候，鍵盤會產生一段長度不等的 scancode，這段 scancode 會被 keyboard driver (像是 drivers/input/keyboard/atkbd.c) 處理，轉換成類型為 EV_MSC 與 EV_KEY 的 input event。EV_MSC 事件的內容是 scancode 本身，與硬體直接相關且不容易處理，除非有特殊需求，通常我們比較關心的是 EV_KEY input event。想要處理這些事件的其它子系統，可以向 input layer 註冊 input handler。例如 evdev 會註冊一個 input handler 讓 userspace 可以從 /dev/input/eventX 直接取得鍵盤事件。kernel 的 console driver 也會向 input layer 註冊一個 handler 來取得鍵盤事件，這是我們這次想要比較深入了解的項目。

console 跟鍵盤的交互作用可以在 drivers/input/char/keyboard.c 看到。在 console 底下，鍵盤有四種模式，


#define VC_XLATE        0 /* translate keycodes using keymap */
#define VC_MEDIUMRAW    1 /* medium raw (keycode) mode */
#define VC_RAW          2 /* raw (scancode) mode */
#define VC_UNICODE      3 /* Unicode mode */

可以利用 kbd_mode 命令來切換。前面有提到 keyboard driver 會送出 EV_MSC 與 EV_KEY 兩種 input event，其中前者送出的 scancode 被用來實作 VC_RAW 模式；後者送出的 keycode，則可以用來實作 VC_MEDIUMRAW 模式。剩下的兩種模式都是 keycode 的再加工。

scancode 到 keycode 的轉換透過了 keyboard driver 定義的 keycode table 完成。在 atkbd.c 裡，如果忽略掉其它細節，它只是簡單的


keycode = atkbd->keycode[code];

一行程式碼。有些多媒體鍵盤會有一些按鍵的 scancode 不在預設的 keycode table 裡，當這些按鍵被按下或放開的時候，kernel 會印出類似


atkbd.c: Unknown key pressed (translated set 2, code 0x1e on isa0060/serio0).
atkbd.c: Use 'setkeycodes 1e <keycode>' to make it known.

的訊息。依照這段訊息提示的方法去做


# setkeycodes <scancode> <keycode>

就可以新增一筆對映的資料。setkeycodes 與 getkeycodes 命令即是用來設定或取得目前的 keycode table。值得注意的是，大部份的 keycode 有對應的 symbolic name，例如 keycode 30 的 symbolic name 是 KEY_A，keycode 48 的是 KEY_B，keycode 46 的是 KEY_C 等 (見 /usr/include/linux/input.h)。這些 symbolic name 是照美式鍵盤定義而來，拿到其它語言的鍵盤上並沒有意義。

console 下 keyboard 預設的模式是 VC_XLATE 或 VC_UNICODE。從 input layer 拿到 keycode 後，console 會呼叫 kbd_event 函數做處理。在這兩個模式下，keycode 會被轉換成 keysym


key_map = key_maps[shift_final];
...
keysym = key_map[keycode];

然後 queue 到 console buffer。stdin 接到 console 的程式即是由這邊取得使用者的輸入。這個動作會經過 line discipline，不過我們這邊不去討論。

一個 keysym 是兩個 byte，分別可以由 KTYP(keysym) 跟 KVAL(keysym) 取得它的 type 與 value。當 type 小於 0xf0 時，整個 keysym 代表一個 UCS2 的 codepoint，keysym 會被轉成 UTF-8 放進 console buffer；當 type >= 0xf0 時，與 type 相關的 handler 被呼叫，其 prototype 為


typedef void (k_handler_fn)(struct vc_data *vc, unsigned char value,
       char up_flag);

其中 value 就是剛剛看到的 KVAL(keysym)。有些 handler 會把處理過的 value 寫入 console buffer，有些則不會，這樣設計的目的以例子來看最容易理解。我們知道 shift 按著的時候，所有的字母大小寫會互換。當 shift 的按下時，鍵盤控制器送出中斷，keyboard driver 收到後把 scancode 讀出並轉成 keycode，送出 input event。console 收到 event 後利用 keymap 把 keycode 轉成 keysym。shift 的 keysym type 是 0xf7，value 是 0x00，送到對應的 handler 中


if (up_flag) {
 if (shift_down[value])
  shift_down[value]--;
} else
 shift_down[value]++;

if (shift_down[value])
 shift_state |= (1 << value);
else
 shift_state &= ~(1 << value);

可以發現 shift_state 的第一個 bit 被設為 1。shift_state 是 keyboard.c 裡的 file-scope 變數，當任何一個按鍵再被按下時，kbd_event 裡這一段程式碼


shift_final = (shift_state | kbd->slockstate) ^ kbd->lockstate;
key_map = key_maps[shift_final];

選取了不同的 keymap，導致或許不一樣的 keysym 被送出，本來是小寫的英文字母也因而變成大寫。

在 kernel 內部實作，console 使用的是 UCS2 編碼。不管是使用者列印到 console 的字串，或者是 keysym 的 value 都會先重新編碼成 UCS2 再做進一步處理。在 VC_UNICODE 模式底下，UCS2 會以 UTF-8 形式被送進 console buffer；在 VC_XLATE 模式，則會嘗試再編碼回原來的 value 送到 console buffer。

相對於 keymap 複雜的機制，它的操作卻非常簡單。在 userspace 可以利用 loadkeys 與 dumpkeys 命令來操作 keymaps


# loadkeys de # 使用德式鍵盤 layout
# loadkeys us # 使用美式鍵盤 layout

進一步的資訊可以參考 keymaps(5)。

這篇文章我們看到了鍵盤在 console 的運作。如果換到 X(org) server，情形有點不同，而且也因驅動程式而異。例如 xf86-input-keyboard 雖然是從 console 取得鍵盤事件，但它會把 console 設為 VC_RAW 模式，自行處理 scancode。而 xf86-input-evdev 則是直接從 /dev/input/eventX 取得鍵盤事件。以後有機會也可以看看 X(org) 下的鍵盤運作。

olv

Friday, January 30, 2009

一千零一夜之 Console I/O

Tuesday, January 27, 2009

一千零一夜之 keyboard in console

About Me

Member of 0xlab

Blog Archive

Search This Blog

olv