99re热这里只有精品视频,7777色鬼xxxx欧美色妇,国产成人精品一区二三区在线观看,内射爽无广熟女亚洲,精品人妻av一区二区三区

OpenResty Lua 什么是 JIT

2021-08-12 16:54 更新

自從 OpenResty 1.5.8.1 版本之后,默認(rèn)捆綁的 Lua 解釋器就被替換成了 LuaJIT,而不再是標(biāo)準(zhǔn) Lua。單從名字上,我們就可以直接看到這個(gè)新的解釋器多了一個(gè) ?JIT?,接下來(lái)我們就一起來(lái)聊聊 ?JIT?。

先看一下 LuaJIT 官方的解釋?zhuān)篖uaJIT is a Just-In-Time Compilerfor the Lua programming language。

LuaJIT 的運(yùn)行時(shí)環(huán)境包括一個(gè)用手寫(xiě)匯編實(shí)現(xiàn)的 Lua 解釋器和一個(gè)可以直接生成機(jī)器代碼的 JIT 編譯器。

Lua 代碼在被執(zhí)行之前總是會(huì)先被 lfn 成 LuaJIT 自己定義的字節(jié)碼(Byte Code)。關(guān)于 LuaJIT 字節(jié)碼的文檔,可以參見(jiàn):http://wiki.luajit.org/Bytecode-2.0(這個(gè)文檔描述的是 LuaJIT 2.0 的字節(jié)碼,不過(guò) 2.1 里面的變化并不算太大)。

一開(kāi)始的時(shí)候,Lua 字節(jié)碼總是被 LuaJIT 的解釋器解釋執(zhí)行。LuaJIT 的解釋器會(huì)在執(zhí)行字節(jié)碼時(shí)同時(shí)記錄一些運(yùn)行時(shí)的統(tǒng)計(jì)信息,比如每個(gè) Lua 函數(shù)調(diào)用入口的實(shí)際運(yùn)行次數(shù),還有每個(gè) Lua 循環(huán)的實(shí)際執(zhí)行次數(shù)。當(dāng)這些次數(shù)超過(guò)某個(gè)預(yù)設(shè)的閾值時(shí),便認(rèn)為對(duì)應(yīng)的 Lua 函數(shù)入口或者對(duì)應(yīng)的 Lua 循環(huán)足夠的“熱”,這時(shí)便會(huì)觸發(fā) JIT 編譯器開(kāi)始工作。

JIT 編譯器會(huì)從熱函數(shù)的入口或者熱循環(huán)的某個(gè)位置開(kāi)始嘗試編譯對(duì)應(yīng)的 Lua 代碼路徑。編譯的過(guò)程是把 LuaJIT 字節(jié)碼先轉(zhuǎn)換成 LuaJIT 自己定義的中間碼(IR),然后再生成針對(duì)目標(biāo)體系結(jié)構(gòu)的機(jī)器碼(比如 x86_64 指令組成的機(jī)器碼)。

如果當(dāng)前 Lua 代碼路徑上的所有的操作都可以被 JIT 編譯器順利編譯,則這條編譯過(guò)的代碼路徑便被稱(chēng)為一個(gè)“trace”,在物理上對(duì)應(yīng)一個(gè) ?trace ?類(lèi)型的 GC 對(duì)象(即參與 Lua GC 的對(duì)象)。

你可以通過(guò) ?ngx-lj-gc-objs? 工具看到指定的 Nginx worker 進(jìn)程里所有 ?trace? 對(duì)象的一些基本的統(tǒng)計(jì)信息,見(jiàn) https://github.com/openresty/stapxx#ngx-lj-gc-objs

比如下面這一行 ?ngx-lj-gc-objs? 工具的輸出

102 trace objects: max=928, avg=337, min=160, sum=34468 (in bytes)

則表明當(dāng)前進(jìn)程內(nèi)的 LuaJIT VM 里一共有 102 個(gè) trace 類(lèi)型的 GC 對(duì) 象,其中最小的 trace 占用 160 個(gè)字節(jié),最大的占用 928 個(gè)字節(jié),平均大小是 337 字節(jié),而所有 trace 的總大小是 34468 個(gè)字節(jié)。

LuaJIT 的 JIT 編譯器的實(shí)現(xiàn)目前還不完整,有一些基本原語(yǔ)它還無(wú)法編譯,比如 pairs() 函數(shù)、unpack() 函數(shù)、string.match() 函數(shù)、基于 lua_CFunction 實(shí)現(xiàn)的 Lua C 模塊、FNEW 字節(jié)碼,等等。所以當(dāng) JIT 編譯器在當(dāng)前代碼路徑上遇到了它不支持的操作,便會(huì)立即終止當(dāng)前的 trace 編譯過(guò)程(這被稱(chēng)為 trace abort),而重新退回到解釋器模式。

JIT 編譯器不支持的原語(yǔ)被稱(chēng)為 NYI(Not Yet Implemented)原語(yǔ)。比較完整的 NYI 列表在這篇文檔里面:

http://wiki.luajit.org/NYI

所謂“讓更多的 Lua 代碼被 JIT 編譯”,其實(shí)就是幫助更多的 Lua 代碼路徑能為 JIT 編譯器所接受。這一般通過(guò)兩種途徑來(lái)實(shí)現(xiàn):

  1. 調(diào)整對(duì)應(yīng)的 Lua 代碼,避免使用 NYI 原語(yǔ)。
  2. 增強(qiáng) JIT 編譯器,讓越來(lái)越多的 NYI 原語(yǔ)能夠被編譯。

對(duì)于第 2 種方式,春哥一直在推動(dòng)公司(CloudFlare)贊助 Mike Pall 的開(kāi)發(fā)工作。不過(guò)有些原語(yǔ)因?yàn)楸旧淼拇鷥r(jià)過(guò)高,而永遠(yuǎn)不會(huì)被編譯,比如基于經(jīng)典的 lua_CFunction 方式實(shí)現(xiàn)的 Lua C 模塊(所以需要盡量通過(guò) LuaJIT 的 FFI 來(lái)調(diào)用 C)。

而對(duì)于第 1 種方法,我們?nèi)绾尾拍苤谰唧w是哪一行 Lua 代碼上的哪一個(gè) NYI 原語(yǔ)終止了 trace 編譯呢?答案很簡(jiǎn)單。就是使用 LuaJIT 安裝自帶的 jit.v 和 jit.dump 這兩個(gè) Lua 模塊。這兩個(gè) Lua 模塊會(huì)打印出 JIT 編譯器工作的細(xì)節(jié)過(guò)程。

在 Nginx 的上下文中,我們可以在 nginx.conf 文件中的 http {} 配置塊中添加下面這一段:

init_by_lua_block {
    local verbose = false
    if verbose then
        local dump = require "jit.dump"
        dump.on(nil, "/tmp/jit.log")
    else
        local v = require "jit.v"
        v.on("/tmp/jit.log")
    end

    require "resty.core"
}

那一行 require "resty.core" 倒并不是必需的,放在那里的主要目的是為了盡量避免使用 ngx_lua 模塊自己的基于 lua_CFunction 的 Lua API,減少 NYI 原語(yǔ)。

在上面這段 Lua 代碼中,當(dāng) verbose 變量為 false 時(shí)(默認(rèn)就為 false 哈),我們使用 jit.v 模塊打印出比較簡(jiǎn)略的流水信息到 /tmp/jit.log 文件中;而當(dāng) verbose 變量為 true 時(shí),我們則使用 jit.dump 模塊打印所有的細(xì)節(jié)信息,包括每個(gè) trace 內(nèi)部的字節(jié)碼、IR 碼和最終生成的機(jī)器指令。

這里我們主要以 jit.v 模塊為例。在啟動(dòng) Nginx 之后,應(yīng)當(dāng)使用 ab 和 weighttp 這樣的工具對(duì)相應(yīng)的服務(wù)接口進(jìn)行預(yù)熱,以觸發(fā) LuaJIT 的 JIT 編譯器開(kāi)始工作(還記得剛才我們說(shuō)的“熱函數(shù)”和“熱循環(huán)”嗎?)。預(yù)熱過(guò)程一般不用太久,跑個(gè)二三百個(gè)請(qǐng)求足矣。當(dāng)然,壓更多的請(qǐng)求也沒(méi)關(guān)系。完事后,我們就可以檢查 /tmp/jit.log 文件里面的輸出了。

jit.v 模塊的輸出里如果有類(lèi)似下面這種帶編號(hào)的 TRACE 行,則指示成功編譯了的 trace 對(duì)象,例如

[TRACE 6 shdict.lua:126 return]

這個(gè) trace 對(duì)象編號(hào)為 6,對(duì)應(yīng)的 Lua 代碼路徑是從 shdict.lua 文件的第 126 行開(kāi)始的。

下面這樣的也是成功編譯了的 trace:

[TRACE  16 (15/1) waf-core.lua:419 -> 15]

這個(gè) trace 編號(hào)為 16,是從 waf-core.lua 文件的第 419 行開(kāi)始的,同時(shí)它和編號(hào)為 15 的 trace 聯(lián)接了起來(lái)。

而下面這個(gè)例子則是被中斷的 trace:

[TRACE --- waf-core.lua:455 -- NYI: FastFunc pairs at waf-core.lua:458]

上面這一行是說(shuō),這個(gè) trace 是從 waf-core.lua 文件的第 455 行開(kāi)始編譯的,但當(dāng)編譯到 waf-core.lua 文件的第 458 行時(shí),遇到了一個(gè) NYI 原語(yǔ)編譯不了,即 pairs() 這個(gè)內(nèi)建函數(shù),于是當(dāng)前的 trace 編譯過(guò)程被迫終止了。

類(lèi)似的例子還有下面這些:

[TRACE --- exit.lua:27 -- NYI: FastFunc coroutine.yield at waf-core.lua:439]
[TRACE --- waf.lua:321 -- NYI: bytecode 51 at raven.lua:107]

上面第二行是因?yàn)椴僮鞔a 51 的 LuaJIT 字節(jié)碼也是 NYI 原語(yǔ),編譯不了。

那么我們?nèi)绾沃?51 字節(jié)碼究竟是啥呢?我們可以用 nginx-devel-utils 項(xiàng)目中的 ljbc.lua 腳本來(lái)取得 51 號(hào)字節(jié)碼的名字:

$ /usr/local/openresty/luajit/bin/luajit-2.1.0-alpha ljbc.lua 51
opcode 51:
FNEW

我們看到原來(lái)是用來(lái)(動(dòng)態(tài))創(chuàng)建 Lua 函數(shù)的 FNEW 字節(jié)碼。ljbc.lua 腳本的位置是

https://github.com/agentzh/nginx-devel-utils/blob/master/ljbc.lua

非常簡(jiǎn)單的一個(gè)腳本,就幾行 Lua 代碼。

這里需要提醒的是,不同版本的 LuaJIT 的字節(jié)碼可能是不相同的,所以一定要使用和你的 Nginx 鏈接的同一個(gè) LuaJIT 來(lái)運(yùn)行這個(gè) ljbc.lua 工具,否則有可能會(huì)得到錯(cuò)誤的結(jié)果。

我們實(shí)際做個(gè)對(duì)比實(shí)驗(yàn),看看 JIT 帶來(lái)的好處:

? cat test.lua
local s = [[aaaaaabbbbbbbcccccccccccddddddddddddeeeeeeeeeeeee
fffffffffffffffffggggggggggggggaaaaaaaaaaabbbbbbbbbbbbbb
ccccccccccclllll]]

for i=1,10000 do
    for j=1,10000 do
        string.find(s, "ll", 1, true)
    end
end

? time luajit test.lua
5.19s user
0.03s system
96% cpu
5.392 total

?  time lua test.lua
9.20s user
0.02s system
99% cpu
9.270 total

本例子可以看到效率相差大約 9.2/5.19 ≈ 1.77 倍,換句話說(shuō)標(biāo)準(zhǔn) Lua 需要 177% 的時(shí)間才能完成同樣的工作。估計(jì)大家覺(jué)得這個(gè)還不過(guò)癮,再看下面示例代碼:

文件 test.lua:

local loop_count = tonumber(arg[1])
local fun_pair = "ipairs" == arg[2] and ipairs or pairs

local t = {}
for i=1,100 do
    t[i] = i
end

for i=1,loop_count do
    for j=1,1000 do
        for k,v in fun_pair(t) do
            --
        end
    end
end
執(zhí)行參數(shù)執(zhí)行結(jié)果
time lua test.lua 1000 ipairs3.96s user 0.02s system 98% cpu 4.039 total
time lua test.lua 1000 pairs3.97s user 0.01s system 99% cpu 3.992 total
time luajit test.lua 1000 ipairs0.10s user 0.00s system 95% cpu 0.113 total
time luajit test.lua 10000 ipairs0.98s user 0.00s system 99% cpu 0.991 total
time luajit test.lua 1000 pairs1.54s user 0.01s system 99% cpu 1.559 total

從這個(gè)執(zhí)行結(jié)果中,大致可以總結(jié)出下面幾個(gè)觀點(diǎn):

  • 在標(biāo)準(zhǔn) Lua 解釋器中,使用 ipairs 或 pairs 沒(méi)有區(qū)別;
  • 對(duì)于 pairs 方式,LuaJIT 的性能大約是標(biāo)準(zhǔn) Lua 的 4 倍;
  • 對(duì)于 ipairs 方式,LuaJIT 的性能大約是標(biāo)準(zhǔn) Lua 的 40 倍。

可以被 JIT 編譯的元操作

下面給大家列一下截止到目前已經(jīng)可以被 JIT 編譯的元操作。 其他還有 IO、Bit、FFI、Coroutine、OS、Package、Debug、JIT 等分類(lèi),使用頻率相對(duì)較低,這里就不羅列了,可以參考官網(wǎng):http://wiki.luajit.org/NYI。

基礎(chǔ)庫(kù)的支持情況

函數(shù)編譯?備注
assertyes
collectgarbageno
dofilenever
errornever
getfenv2.1 partial只有 getfenv(0) 能編譯
getmetatableyes
ipairsyes
loadnever
loadfilenever
loadstringnever
nextno
pairsno
pcallyes
printno
rawequalyes
rawgetyes
rawlen (5.2)yes
rawsetyes
selectpartial第一個(gè)參數(shù)是靜態(tài)變量的時(shí)候可以編譯
setfenvno
setmetatableyes
tonumberpartial不能編譯非10進(jìn)制,非預(yù)期的異常輸入
tostringpartial只能編譯:字符串、數(shù)字、布爾、nil 以及支持 __tostring元方法的類(lèi)型
typeyes
unpackno
xpcallyes

字符串庫(kù)

函數(shù)編譯?備注
string.byteyes
string.char2.1
string.dumpnever
string.find2.1 partial只有字符串樣式查找(沒(méi)有樣式)
string.format2.1 partial不支持 %p 或 非字符串參數(shù)的 %s
string.gmatchno
string.gsubno
string.lenyes
string.lower2.1
string.matchno
string.rep2.1
string.reverse2.1
string.subyes
string.upper2.1

函數(shù)編譯?備注
table.concat2.1
table.foreachno2.1: 內(nèi)部編譯,但還沒(méi)有外放
table.foreachi2.1
table.getnyes
table.insertpartial只有 push 操作
table.maxnno
table.pack (5.2)no
table.remove2.1部分,只有 pop 操作
table.sortno
table.unpack (5.2)no

math 庫(kù)

函數(shù)編譯?備注
math.absyes
math.acosyes
math.asinyes
math.atanyes
math.atan2yes
math.ceilyes
math.cosyes
math.coshyes
math.degyes
math.expyes
math.flooryes
math.fmodno
math.frexpno
math.ldexpyes
math.logyes
math.log10yes
math.maxyes
math.minyes
math.modfyes
math.powyes
math.radyes
math.randomyes
math.randomseedno
math.sinyes
math.sinhyes
math.sqrtyes
math.tanyes
math.tanhyes


以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)