2008年1月11日

Jasmin 筆記



現在做 Compiler,分三個部份,scanner 用 flex/scangen,parser 用 bison/yacc/llgen,剩下 code generation 可以直接輸出 assembly code 來做,也可輸出成 JVM bytecode。我之前沒學過 assembly code,直接學學這個也不錯,概念和 x86 差不多吧。


JVM 也屬 stack based machine platform (其他比如 PowerPC, x86, MIPS 等),但仍有些不同:

  1. 最主要不同是 JVM 的資料結構是一個稱為 Constant Pool table,在 .class 檔內用來描述 classes, function 以及 variables。

  2. JVM 禁止 memory reference,取得變數和函數方式會不同,而且沒有 global variables,要特別處理,比如要生成一個類別來處理 global variables.



若要參考 JVM Specification 來生成 binary 的 bytecode 當然很累,所以,有個現成的程式 Jasmin (即 JVM 的 assembler) 來使用,就比較方便了。


一般 .java 檔經 javac 轉成 .class (bytecode file)
public class HelloWorld { 
public static void main(String args[]) {
System.out.println("Hello World!!");
}
}


javap 用來 disassemble VM 指令,即可以知道一個 class 檔由哪些指令組成:
[derjohng@derjohngdediannao 551] $ javap -c HelloWorld 
Compiled from "HelloWorld.java"
public class HelloWorld extends java.lang.Object{
public HelloWorld();
Code:
0: aload_0
1: invokespecial #1; //Method java/lang/Object."<init>":()V
4: return

public static void main(java.lang.String[]);
Code:
0: getstatic #2; //Field java/lang/System.out:Ljava/io/PrintStream;
3: ldc #3; //String Hello World!!
5: invokevirtual #4; //Method java/io/PrintStream.println:(Ljava/lang/String;)V
8: return
}


Jasmin 則是將 VM 指令寫成的檔案,轉成 bytecode file. 可視為 JVM 的一種 assembler,比如下列產生一個 HelloWord.j,執行 $jasmin HelloWord.j ,即會產生 HelloWord.class
 
.class public HelloWorld
.super java/lang/Object

; specify the constructor method for the HelloWorld class
.method public <init>()V
aload_0
invokenonvirtual java/lang/Object/<init>()V
return
.end method

; specify the "main" method - this prints "Hello World"
.method public static main([Ljava/lang/String;)V
.limit stack 2
.limit locals 2

; 將 output stream 和 string "Hello World!" 放到 stack.
getstatic java/lang/System/out Ljava/io/PrintStream;
ldc "Hello World!"
invokevirtual java/io/PrintStream/println(Ljava/lang/String;)V

return
.end method


簡短的 Jasmin 使用說明,參考這裡


更仔細的說明,參考 The Java Virtual Machine Specification, Chapter 7.


參考

  1. C Compiler Targeting the Java Virtual Machine

  2. The Java Virtual Machine Specification

  3. Java Virtual Machine




2007.12.22 jasmin 產生的 class 檔案,用 java 執行,會有下述的 Error 出現
 
Exception in thread "main" java.lang.ClassFormatError: Absent Code
attribute in method that is not native or abstract in class file Main


Ans: 問題在於 method 內的 .limit stack 以及 .limit locals 一定要指定,這兩個值只能多給,不能少給。



2007.12.28 根據 Jasmin 手冊, .field 可以類似下面的用法:
 
.class public MyAda.Main
.super java/lang/Object

.field public XXX I = 20
.field public YYY D = 10.560000


但 jasmin 產生的 bytecode 用 javap -c 來看發現,其實並沒有給予起始值
 
Compiled from "Main.j"
public class MyAda.Main extends java.lang.Object{
public int XXX;
public double YYY;

public MyAda.Main();
Code:
0: aload_0
1: invokespecial #46; //Method java/lang/Object."":()V
4: return


用下述的 java 檔,編成 class 檔
 
public class HelloWorld5 {
public int iii=5;


會產生如下:
 
javap -c HelloWorld5
Compiled from "HelloWorld5.java"
public class HelloWorld5 extends java.lang.Object{
public int iii;

public HelloWorld5();
Code:
0: aload_0
1: invokespecial #1; //Method java/lang/Object."":()V
4: aload_0
5: iconst_5
6: putfield #2; //Field iii:I
9: return


所以,這些值是放在 <init>() 下,但 jasmin 下 .method public <init>()V 要自己產生,所以,要另外用 putfield 來給予啟始值了? !!昏頭!! 用 .field 的 assign 值不就沒意義了?





Orignal From: Jasmin 筆記