Programación en Ensamblador (de Java): Hola Mundo

Iniciado por ~, 3 Julio 2012, 00:37 AM

0 Miembros y 1 Visitante están viendo este tema.

~

Como nota inicial, si alguien no tiene una mejor idea de cuál sería la mejor forma de que escriba varios posts como respuestas seguidas, incluso quizás después de varias semanas, pido disculpas si envío respuestas a este tema o abro otros nuevos, porque seguramente va a ser mucha la complejidad a manejar, y repartir las diferentes etapas de descubrimientos es mucho más fácil repartiéndolas en diferentes posts, temas y/o respuestas (que serían continuas a menos que alguien responda o consulte algo, o tenga una idea de qué más averiguar o hacer algo interesante y útil con todo esto desde ya, aparte obviamente de realmente aprender Java).

Me tomo la libertad de escribir sobre la programación en ensamblador, pero en el lenguaje dictado por el bytecode de Java.

Las razones más importantes de esto son:

- Para personas demasiado acostumbradas a trabajar con lenguajes al nivel de C o más bajos, trabajar con un ensamblador en un entorno nativo a la orientación a objetos hace mucho más fácil entender a cabalidad cómo funciona realmente la orientación a objetos, en este caso, de Java.

- Dado que Java es una plataforma unificada sin importar el hardware sobre el que corra, estudiarlo a nivel de ensamblador es una oportunidad excepcionalmente buena para practicar la ingeniería inversa y obtener un nivel de experticia por lo menos intermedio.

- Siendo expertos en el ensamblador de Java y en el formato de archivos de bytecode (.class), así como en el uso de las diferentes APIs y teniendo experticia suficiente para escribir un compilador no optimizador como mínimo, se puede dejar de usar el lenguaje Java para producir programas de Java, y eventualmente es posible usar virtualmente cualquier otro lenguaje de programación (incluso ensamblador de Intel x86, e incluso enmascarando las APIs de Java para usarlas como "alias" de otras plataformas como WinAPI o javascript, y así "recortar" un poco lo que se necesita aprender, y unificar un mismo conocimiento en diferentes ambientes de desarrollo). Esto puede llegar a ser especialmente útil, porque significaría que muchos programas escritos lenguajes que tradicinalmente tienen poca o ninguna portabilidad entre plataformas de hardware pueden reutilizarse, convirtiéndolos en instrucciones de bytecode de Java.

- El ensamblador de Java es extremadamente valioso. Los lenguajes de ensamblador "normales" son evitados por la mayoría de programadores no solo por su complejidad, sino que por el hecho de que no están pensados para ser portables. Con Java, los programas generados son más simples que los ejecutables ELF de Linux, y el ensamblador que se escriba en una plataforma, puede correr en cualquier otra en la que haya una JVM. Eso significa que se pueden hacer tareas interesantes de muy bajo nivel, que al mismo tiempo incluyan programación "moderna" orientada a objetos, con la posibilidad de poder seguir corriendo el mismo código en otras plataformas.


Todo esto suena muy interesante, pero para lograrlo, siendo indistintamente buenos programadores de C/ensamblador por ejemplo, o buenos programadores de Java (aunque a un nivel común y corriente, no a nivel de ensamblador y de la arquitectura central), este proceso puede llevar no menos de un año, durante el que hay que releer cosas como el Tutorial de Java, compilar los programas de ejemplo, hacer ingeniería inversa intensa y desensamblarlos (NO decompilarlos, sino que inspeccionar los archivos binarios a mano si es posible y/o hacer un parser), y leer una y otra vez las partes de las especificaciones que se están aplicando en cada ejemplo compilado.

------------------------------------------------------
------------------------------------------------------
------------------------------------------------------
------------------------------------------------------

Pongo un ejemplo simple de un Hola Mundo, como el del Tutorial de Java, pero en Ensamblador de Java.

No he usado un ensamblador nativo de Java "apropiado" sino que NASM, que entre otras cosas no permite usar Big Endian (Java) sino solo Little Endian (x86), así que se ve rápidamente la necesidad de usar un programa ensamblador ya sea de ARM que use Big Endian por defecto, crear un ensamblador propio para Java (en javascript por ejemplo), o buscar un ensamblador "apropiado" nativo a Java.

Esto debe compilarse con lo siguiente, ya sea en Windows, Linux, etc.:

nasm EHLOWorldApp.asm -o EHLOWorldApp.class



;/*****************************************************************************
;EHLOWorldApp.java
;
; 2012-07-02
;
;
;Demostración inicial de un programa de Java escrito totalmente en ensamblador
;(ensamblador de Java, pero usando NASM para codificar los bytes).
;
;http://devel.cable-modem.org/
;
;Este código es de dominio público (sin derechos de autor).
;Puedes hacer lo que desees con él.
;
;
;*****************************************************************************/


_CLASS_START:

_00000000__magic db 0xCA,0xFE,0xBA,0xBE


_00000004__minor_version dw 0x0000


_00000006__major_version db 0x00,0x33


_00000008__constant_pool_count db 0,29+1

   _0000000A__cp_info_0001:
                          db 0x0A    ;cp_info.tag: CONSTANT_Methodref
                          db 0,0x06  ;cp_info.info.class_index
                          db 0,0x0F  ;cp_info.info.name_and_type_index

   _0000000F__cp_info_00002:
                          db 0x09    ;cp_info.tag: CONSTANT_Fieldref
                          db 0,0x10  ;cp_info.info.class_index
                          db 0,0x11  ;cp_info.info.name_and_type_index

   _00000014__cp_info_0003:
                          db 0x08    ;cp_info.tag: CONSTANT_String
                          db 0,0x12  ;cp_info.info.string_index

   _00000017__cp_info_0004:
                          db 0x0A    ;cp_info.tag: CONSTANT_Methodref
                          db 0,0x13  ;cp_info.info.class_index
                          db 0,0x14  ;cp_info.info.name_and_type_index

   _0000001C__cp_info_0005:
                          db 0x07    ;cp_info.tag: CONSTANT_Class
                          db 0,0x15  ;cp_info.info.name_index

   _0000001F__cp_info_0006:
                          db 0x07    ;cp_info.tag: CONSTANT_Class
                          db 0,0x16  ;cp_info.info.name_index

   _00000022__cp_info_0007:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x06   ;cp_info.info.length
                          db "<init>" ;cp_info.info.bytes[length]

   _0000002B__cp_info_0008:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x03   ;cp_info.info.length
                          db "()V"    ;cp_info.info.bytes[length]

   _00000031__cp_info_0009:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x04   ;cp_info.info.length
                          db "Code"   ;cp_info.info.bytes[length]

   _00000038__cp_info_000A:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x0F   ;cp_info.info.length
                          db "LineNumberTable"   ;cp_info.info.bytes[length]

   _0000004A__cp_info_000B:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x04   ;cp_info.info.length
                          db "main"   ;cp_info.info.bytes[length]

   _00000051__cp_info_000C:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x16   ;cp_info.info.length
                          db "([Ljava/lang/String;)V"   ;cp_info.info.bytes[length]

   _0000006A__cp_info_000D:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x0A   ;cp_info.info.length
                          db "SourceFile"   ;cp_info.info.bytes[length]

   _00000077__cp_info_000E:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x11   ;cp_info.info.length
                          db "EHLOWorldApp.java"   ;cp_info.info.bytes[length]

   _0000008B__cp_info_000F:
                          db 0x0C     ;cp_info.tag: CONSTANT_NameAndType
                          db 0,0x07   ;cp_info.info.name_index
                          db 0,0x08   ;cp_info.info.descriptor_index

   _00000090__cp_info_0010:
                          db 0x07    ;cp_info.tag: CONSTANT_Class
                          db 0,0x17  ;cp_info.info.name_index

   _00000093__cp_info_0011:
                          db 0x0C     ;cp_info.tag: CONSTANT_NameAndType
                          db 0,0x18   ;cp_info.info.name_index
                          db 0,0x19   ;cp_info.info.descriptor_index

   _00000098__cp_info_0012:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x0C   ;cp_info.info.length
                          db "Hello World."   ;cp_info.info.bytes[length]

   _000000A6__cp_info_0013:
                          db 0x07    ;cp_info.tag: CONSTANT_Class
                          db 0,0x1A  ;cp_info.info.name_index

   _000000A9__cp_info_0014:
                          db 0x0C     ;cp_info.tag: CONSTANT_NameAndType
                          db 0,0x1B   ;cp_info.info.name_index
                          db 0,0x1C   ;cp_info.info.descriptor_index

   _000000AE__cp_info_0015:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x0C   ;cp_info.info.length
                          db "EHLOWorldApp"   ;cp_info.info.bytes[length]

   _000000BD__cp_info_0016:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x10   ;cp_info.info.length
                          db "java/lang/Object"   ;cp_info.info.bytes[length]

   _000000D0__cp_info_0017:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x10   ;cp_info.info.length
                          db "java/lang/System"   ;cp_info.info.bytes[length]

   _000000E3__cp_info_0018:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x03   ;cp_info.info.length
                          db "out"   ;cp_info.info.bytes[length]

   _000000E9__cp_info_0019:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x15   ;cp_info.info.length
                          db "Ljava/io/PrintStream;"   ;cp_info.info.bytes[length]

   _00000101__cp_info_001A:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x13   ;cp_info.info.length
                          db "java/io/PrintStream"   ;cp_info.info.bytes[length]

   _00000117__cp_info_001B:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x07   ;cp_info.info.length
                          db "println"   ;cp_info.info.bytes[length]

   _00000121__cp_info_001C:
                          db 0x01     ;cp_info.tag: CONSTANT_Utf8
                          db 0,0x15   ;cp_info.info.length
                          db "(Ljava/lang/String;)V"   ;cp_info.info.bytes[length]

                       __1D:
                          db 0x08    ;cp_info.tag: CONSTANT_String
                          db 0,0x12  ;cp_info.info.string_index




_00000139__access_flags:
                      db 0x00,0x20


_0000013B__this_class:
                      db 0x00,0x05

_0000013D__super_class:
                      db 0x00,0x06

_0000013F__interfaces_count:
                      db 0x00,0x00

;interfaces ------- no interfaces


_00000141__fields_count:
                      db 0x00,0x00


;field_info ------- no fields


_00000143__methods_count:
                      db 0x00,0x02


       _00000145__method_info_0001:
                              db 0x00,0x00     ;access_flags
                              db 0x00,0x07     ;name_index
                              db 0x00,0x08     ;descriptor_index
                              db 0x00,0x01     ;attributes_count
                                  db 0x00,0x09   ;code_attribute/attribute_info[0].attribute_name_index
                                  db 0x00,0x00,0x00,(0x1D)   ;code_attribute/attribute_info[0].attribute_length

                                  db 0X00,0X01       ;code_attribute.max_stack
                                  db 0X00,0X01       ;code_attribute.max_locals
                                  db 0X00,0X00,0X00,0X05   ;code_attribute.code_length

                                     ;INIT: Instructions
                                     ;INIT: Instructions
                                     ;INIT: Instructions
                                     ;INIT: Instructions

                                       db 0X2A         ;aload_0

                                       db 0XB7         ;invokespecial #1
                                       db 0X00
                                       db 0X01

                                       db 0XB1         ;return

                                     ;END: Instructions
                                     ;END: Instructions
                                     ;END: Instructions
                                     ;END: Instructions



                                  db 0X00,0X00    ;code_attribute.exception_table_length


                                  db 0X00,0x01    ;code_attribute.attributes_count       ;1

                                      db 0X00,0X0A             ;LineNumberTable_attribute/attribute_info.attribute_name_index
                                      db 0X00,0X00,0X00,0X06   ;LineNumberTable_attribute/attribute_info.attribute_length
                                          db 0X00,0X01       ;LineNumberTable_attribute.line_number_table_length
                                              db 0X00,0X00       ;line_number_table[0].start_pc
                                              db 0X00,0X05       ;line_number_table[0].line_number


;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
       _00000170__method_info_0002:
                              db 0x00,0x09     ;access_flags
                              db 0x00,0x0B     ;name_index
                              db 0x00,0x0C     ;descriptor_index
                              db 0x00,0x01     ;attributes_count
                                  db 0x00,0x09   ;code_atribute/attribute_info[0].attribute_name_index
                                  db 0x00,0x00,0x00,(0x25)   ;code_atribute/attribute_info[0].attribute_length
x17E:
                                  db 0x00,0x02      ;code_attribute.max_stack
                                  db 0x00,0x01      ;code_attribute.max_locals
                                  db 0x00,0x00,0x00,(0x09)  ;code_attribute.code_length

                                     ;INIT: Instructions
                                     ;INIT: Instructions
                                     ;INIT: Instructions
                                     ;INIT: Instructions


                                       db 0xB2      ;getstatic #2
                                       db 0x00
                                       db 0x02

                                       db 0x12      ;ldc #3
                                       db 0x1D

                                       db 0xB6      ;invokevirtual #4
                                       db 0x00
                                       db 0x04

                                       db 0xB1      ;return

                                     ;END: Instructions
                                     ;END: Instructions
                                     ;END: Instructions
                                     ;END: Instructions

                                  db 0x00,0x00      ;code_attribute.exception_table_length


                                  db 0x00,0x01      ;code_attribute.attributes_count    ;1

                                      db 0x00,0x0A              ;LineNumberTable_attribute/attrbute_info.attribute_name_index
                                      db 0x00,0x00,0x00,0x0A    ;LineNumberTable_attribute/attribute_info.attribute_length
                                            db 0x00,0x02       ;LineNumberTable_attribute.line_number_table_length
                                                db 0x00,0x00       ;line_number_table[0].start_pc
                                                db 0x00,0x07       ;line_number_table[0].line_number

                                                db 0x00,0x08       ;line_number_table[1].start_pc
                                                db 0x00,0x08       ;line_number_table[1].line_number



;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
f_000001A3__attributes_count db 0x00,0x01     ;attributes_count           ;1
                               db 0x00,0x0D   ;SourceFile_attribute/attribute_info[0].attribute_name_index
                               db 0x00,0x00,0x00,0x02   ;SourceFile_attribute/attribute_info[0].attribute_length


                               db 0x00,0x0E         ;SourceFile_attribute.sourcefile_index




Y el código equivalente en Java normal:


class EHLOWorldApp
{
public static void main(String[] args)
{
 System.out.println("Hello World.");
}
}




Planeo poco a poco documentar y explicar lo que está pasando, aunque ya que he comentado prácticamente todas las líneas en ensamblador, obviamente entiendo lo que está pasando.

Aunque necesito formalizar las explicaciones, porque voy a necesitarlo cuando trate escribir un ensamblador especial para Java y cuando quiera implementar un compilador de un lenguaje que no sea Java, pero que produzca programas para Java.


------------------------------------------------------
------------------------------------------------------
------------------------------------------------------
------------------------------------------------------




Referencias

Seguir las especificaciones es relativamente fácil para quienes, como yo, están acostumbrados a examinar de forma permanente la estructura de todos los archivos en su computadora, a hacer encajar exactamente cada pieza de un programa en ensamblador (lo que permite encontrar mucho más rápidamente la causa de errores causados por dos o más valores interdependientes) y a pensar en términos de cómo las especificaciones combinan los datos requeridos para una tarea en estructuras de todo tipo (y teniendo en mente qué pudieron haber estado pensando los desarrolladores de dichos estándares para hacer las cosas de la forma en que las hicieron de entre muchos diseños posibles e incluso mucho más simplificados).

Como dije, una de las intenciones principales de todo esto es eventualmente poder escribir programas de Java con lenguajes "normales", como C, Visual Basic, Pascal, etc.

Pero para eso se necesita tener gran experticia en el ensamblador de Java, y en la estructura de bajo nivel del lenguaje, las clases, y todos los demás aspectos de la máquina virtual de Java, para poder crear equivalentes para hacer que de un lenguaje no oficial se pueda producir bytecode apropiado y totalmente correcto.

Esta es la lista de lo que hay que empezar a leer, y no hay que olvidar tampoco las referencias de las diferentes APIs, y también el tutorial de Java, que sería extremadamente interesante "remasterizar" en su versión en ensamblador Java, para comprender cada detalle de lo que contiene y hacer posible que se convierta en un libro de alto nivel capaz de volver a un programador en un experto absoluto en Java, ya sea programando en alto nivel o en el nivel más bajo posible:


Especificaciones de bajo nivel de Java

El capítulo 4 habla específicamente del formato de los archivos .class


Wikipedia: Formato de los archivos .class

Wikipedia: Resumen del bytecode de Java

Wikipedia: Resumen del conjunto de instrucciones de Java


También vale la pena mencionar el comando básico del desensamblador del JDK:

javap -c EHLOWorldApp.class
Sitio web (si la siguiente imagen no aparece es porque está offline):

_Enko

#1
Dejo otro ejemplo interesante
Con macros de fasm para poder programar mas facil.
http://board.flatassembler.net/topic.php?t=13961



T_BOOLEAN = 4
T_CHAR  = 5
T_FLOAT   = 6
T_DOUBLE  = 7
T_BYTE  = 8
T_SHORT   = 9
T_INT  = 10
T_LONG  = 11

macro aaload { db 0x32 }

macro aastore { db 0x53 }

macro aconst_null { db 0x01 }

macro aload index { if index>=0 & index<=3
     db 0x2a+index
   else if index<100h
     db 0x19,index
   else
     db 0xc4,0x19,(index) shr 8,(index) and 0FFh
   end if }

macro anewarray class { db 0xbd,(class) shr 8,(class) and 0FFh }

macro areturn { db 0xb0 }

macro arraylength { db 0xbe }

macro astore index { if index>=0 & index<=3
      db 0x4b+index
    else if index<100h
      db 0x3a,index
    else
      db 0xc4,0x3a,(index) shr 8,(index) and 0FFh
    end if }

macro athrow { db 0xbf }

macro baload { db 0x33 }

macro bastore { db 0x54 }

macro bipush byte { if byte>-1 & byte<=5
    db 0x03+byte
   else
    db 0x10,byte
   end if }

macro caload { db 0x34 }

macro castore { db 0x55 }

macro checkcast class { db 0xc0,(class) shr 8,(class) and 0FFh }

macro d2f { db 0x90 }

macro d2i { db 0x8e }

macro d2l { db 0x8f }

macro dadd { db 0x63 }

macro daload { db 0x31 }

macro dastore { db 0x52 }

macro dcmpg { db 0x98 }

macro dcmpl { db 0x97 }

macro dconst_0 { db 0x0e }

macro dconst_1 { db 0x0f }

macro ddiv { db 0x6f }

macro dload index { if index>=0 & index<=3
     db 0x26+index
   else if index<100h
     db 0x18,index
   else
     db 0xc4,0x18,(index) shr 8,(index) and 0FFh
   end if }

macro dmul { db 0x6b }

macro dneg { db 0x77 }

macro drem { db 0x73 }

macro dreturn { db 0xaf }

macro dstore index { if index>=0 & index<=3
      db 0x47+index
    else if index<100h
      db 0x39,index
    else
      db 0xc4,0x39,(index) shr 8,(index) and 0FFh
    end if }

macro dsub { db 0x67 }

macro dup { db 0x59 }

macro dup_x1 { db 0x5a }

macro dup_x2 { db 0x5b }

macro dup2 { db 0x5c }

macro dup2_x1 { db 0x5d }

macro dup2_x2 { db 0x5e }

macro f2d { db 0x8d }

macro f2i { db 0x8b }

macro f2l { db 0x8c }

macro fadd { db 0x62 }

macro faload { db 0x30 }

macro fastore { db 0x51 }

macro fcmpg { db 0x96 }

macro fcmpl { db 0x95 }

macro fconst_0 { db 0x0b }

macro fconst_1 { db 0x0c }

macro fconst_2 { db 0x0d }

macro fdiv { db 0x6e }

macro fload index { if index>=0 & index<=3
     db 0x22+index
   else if index<100h
     db 0x17,index
   else
     db 0xc4,0x17,(index) shr 8,(index) and 0FFh
   end if }

macro fmul { db 0x6a }

macro fneg { db 0x76 }

macro frem { db 0x72 }

macro freturn { db 0xae }

macro fstore index { if index>=0 & index<=3
      db 0x43+index
    else if index<100h
      db 0x38,index
    else
      db 0xc4,0x38,(index) shr 8,(index) and 0FFh
    end if }

macro fsub { db 0x66 }

macro getfield index { db 0xb4,(index) shr 8,(index) and 0FFh }

macro getstatic index { db 0xb2,(index) shr 8,(index) and 0FFh }

macro goto branch { if branch-$>=-8000h & branch-$<8000h
     offset = word branch-$
     db 0xa7,(offset) shr 8,(offset) and 0FFh
   else
     offset = dword branch-$
     db 0xc8,(offset) shr 24,((offset) shr 16) and 0FFh,((offset) shr 8) and 0FFh,(offset) and 0FFh
   end if }

macro goto_w branch { offset = dword branch-$
     db 0xc8,(offset) shr 24,((offset) shr 16) and 0FFh,((offset) shr 8) and 0FFh,(offset) and 0FFh }

macro i2b { db 0x91 }

macro i2c { db 0x92 }

macro i2d { db 0x87 }

macro i2f { db 0x86 }

macro i2l { db 0x85 }

macro i2s { db 0x93 }

macro iadd { db 0x60 }

macro iaload { db 0x2e }

macro iand { db 0x7e }

macro iastore { db 0x4f }

macro iconst_m1 { db 0x02 }

macro iconst_0 { db 0x03 }

macro iconst_1 { db 0x04 }

macro iconst_2 { db 0x05 }

macro iconst_3 { db 0x06 }

macro iconst_4 { db 0x07 }

macro iconst_5 { db 0x08 }

macro idiv { db 0x6c }

macro if_acmpeq branch { offset = word branch-$
db 0xa5,(offset) shr 8,(offset) and 0FFh }

macro if_acmpne branch { offset = word branch-$
db 0xa6,(offset) shr 8,(offset) and 0FFh }

macro if_icmpeq branch { offset = word branch-$
db 0x9f,(offset) shr 8,(offset) and 0FFh }

macro if_icmpne branch { offset = word branch-$
db 0xa0,(offset) shr 8,(offset) and 0FFh }

macro if_icmplt branch { offset = word branch-$
db 0xa1,(offset) shr 8,(offset) and 0FFh }

macro if_icmpge branch { offset = word branch-$
db 0xa2,(offset) shr 8,(offset) and 0FFh }

macro if_icmpgt branch { offset = word branch-$
db 0xa3,(offset) shr 8,(offset) and 0FFh }

macro if_icmple branch { offset = word branch-$
db 0xa4,(offset) shr 8,(offset) and 0FFh }

macro ifeq branch { offset = word branch-$
   db 0x99,(offset) shr 8,(offset) and 0FFh }

macro ifne branch { offset = word branch-$
   db 0x9a,(offset) shr 8,(offset) and 0FFh }

macro iflt branch { offset = word branch-$
   db 0x9b,(offset) shr 8,(offset) and 0FFh }

macro ifge branch { offset = word branch-$
   db 0x9c,(offset) shr 8,(offset) and 0FFh }

macro ifgt branch { offset = word branch-$
   db 0x9d,(offset) shr 8,(offset) and 0FFh }

macro ifle branch { offset = word branch-$
   db 0x9e,(offset) shr 8,(offset) and 0FFh }

macro ifnonnull branch { offset = word branch-$
db 0xc7,(offset) shr 8,(offset) and 0FFh }

macro ifnull branch { offset = word branch-$
     db 0xc6,(offset) shr 8,(offset) and 0FFh }

macro iinc index,const { if index<100h & const<80h & const>=-80h
  db 0x84,index,const
else
  db 0xc4,0x84,(index) shr 8,(index) and 0FFh,(const) shr 8,(const) and 0FFh
end if }

macro iload index { if index>=0 & index<=3
     db 0x1a+index
   else if index<100h
     db 0x15,index
   else
     db 0xc4,0x15,(index) shr 8,(index) and 0FFh
   end if }

macro imul { db 0x68 }

macro ineg { db 0x74 }

macro instanceof index { db 0xc1,(index) shr 8,(index) and 0FFh }

macro invokedynamic index { db 0xba,(index) shr 8,(index) and 0FFh,0,0 }

macro invokeinterface index,count { db 0xb9,(index) shr 8,(index) and 0FFh,count }

macro invokespecial index { db 0xb7,(index) shr 8,(index) and 0FFh }

macro invokestatic index { db 0xb8,(index) shr 8,(index) and 0FFh }

macro invokevirtual index { db 0xb6,(index) shr 8,(index) and 0FFh }

macro ior { db 0x80 }

macro irem { db 0x70 }

macro ireturn { db 0xac }

macro ishl { db 0x78 }

macro ishr { db 0x7a }

macro istore index { if index>=0 & index<=3
      db 0x3b+index
    else if index<100h
      db 0x36,index
    else
      db 0xc4,0x36,(index) shr 8,(index) and 0FFh
    end if }

macro isub { db 0x64 }

macro iushr { db 0x7c }

macro ixor { db 0x82 }

macro jsr branch { if branch-$>=-8000h & branch-$<8000h
    offset = word branch-$
    db 0xa8,(offset) shr 8,(offset) and 0FFh
  else
    offset = dword branch-$
    db 0xc9,(offset) shr 24,((offset) shr 16) and 0FFh,((offset) shr 8) and 0FFh,(offset) and 0FFh
  end if }

macro jsr_w branch { offset = dword branch-$
    db 0xc9,(offset) shr 24,((offset) shr 16) and 0FFh,((offset) shr 8) and 0FFh,(offset) and 0FFh }

macro l2d { db 0x8a }

macro l2f { db 0x89 }

macro l2i { db 0x88 }

macro ladd { db 0x61 }

macro laload { db 0x2f }

macro land { db 0x7f }

macro lastore { db 0x50 }

macro lcmp { db 0x94 }

macro lconst_0 { db 0x09 }

macro lconst_1 { db 0x0a }

macro ldc index { if index<100h
  db 0x12,index
 else
  db 0x13,(index) shr 8,(index) and 0FFh
 end if}

macro ldc_w index { db 0x13,(index) shr 8,(index) and 0FFh }

macro ldc2_w index { db 0x14,(index) shr 8,(index) and 0FFh }

macro ldiv { db 0x6d }

macro lload index { if index>=0 & index<=3
     db 0x1e+index
   else if index<100h
     db 0x16,index
   else
     db 0xc4,0x16,(index) shr 8,(index) and 0FFh
   end if }

macro lmul { db 0x69 }

macro lneg { db 0x75 }

; macro lookupswitch { db 0xab,... }

macro lor { db 0x81 }

macro lrem { db 0x71 }

macro lreturn { db 0xad }

macro lshl { db 0x79 }

macro lshr { db 0x7b }

macro lstore index { if index>=0 & index<=3
      db 0x3f+index
    else if index<100h
      db 0x37,index
    else
      db 0xc4,0x37,(index) shr 8,(index) and 0FFh
    end if }

macro lsub { db 0x65 }

macro lushr { db 0x7d }

macro lxor { db 0x83 }

macro monitorenter { db 0xc2 }

macro monitorexit { db 0xc3 }

macro multianewarray index,dimensions { db 0xc5,(index) shr 8,(index) and 0FFh,dimensions }

macro new index { db 0xbb,(index) shr 8,(index) and 0FFh }

macro newarray atype { db 0xbc,atype }

macro nop { db 0x00 }

macro pop { db 0x57 }

macro pop2 { db 0x58 }

macro putfield index { db 0xb5,(index) shr 8,(index) and 0FFh }

macro putstatic index { db 0xb3,(index) shr 8,(index) and 0FFh }

macro ret index { if index<100h
   db 0xa9,index
 else
   db 0xc4,(index) shr 8,(index) and 0FFh
 end if }

macro return { db 0xb1 }

macro saload { db 0x35 }

macro sastore { db 0x56 }

macro sipush short { db 0x11,(short) shr 8,(short) and 0FFh }

macro swap { db 0x5f }

; macro tableswitch { db 0xaa,... }

macro breakpoint { db 0xca }

macro impdep1 { db 0xfe }

macro impdep2 { db 0xff }




ACC_PUBLIC = 0x0001
ACC_PRIVATE = 0x0002
ACC_PROTECTED = 0x0004
ACC_STATIC = 0x0008
ACC_FINAL = 0x0010
ACC_SUPER = 0x0020
ACC_SYNCHRONIZED = 0x0020
ACC_NATIVE = 0x0200
ACC_INTERFACE = 0x0200
ACC_ABSTRACT = 0x0400
ACC_STRICT = 0x0800

macro u1 [v] { db v }
macro u2 [v] { db (v) shr 8,(v) and 0FFh }
macro u4 [v] { db (v) shr 24,((v) shr 16) and 0FFh,((v) shr 8) and 0FFh,(v) and 0FFh }

macro constant_pool {

 u2 constant_pool_count
 constant_pool_counter = 1

 struc constant_utf8 [string] \{
   common
     . = constant_pool_counter
     constant_pool_counter = constant_pool_counter + 1
     local ..data,..length
     u1 1
     u2 ..length
     ..data: db string
     ..length = $ - ..data
 \}

 struc constant_integer value \{
   . = constant_pool_counter
   constant_pool_counter = constant_pool_counter + 1
   u1 3
   u4 value
 \}

 struc constant_float value \{
   . = constant_pool_counter
   constant_pool_counter = constant_pool_counter + 1
   u1 4
   u4 value
 \}

 struc constant_long value \{
   . = constant_pool_counter
   constant_pool_counter = constant_pool_counter + 1
   u1 5
   u4 value shr 32,value and 0FFFFFFFFh
 \}

 struc constant_double value \{
   . = constant_pool_counter
   constant_pool_counter = constant_pool_counter + 1
   u1 6
   u4 value shr 32,value and 0FFFFFFFFh
 \}

 struc constant_class name_index \{
   . = constant_pool_counter
   constant_pool_counter = constant_pool_counter + 1
   u1 7
   u2 name_index
 \}

 struc constant_string string_index \{
   . = constant_pool_counter
   constant_pool_counter = constant_pool_counter + 1
   u1 8
   u2 string_index
 \}

 struc constant_fieldref class_index,name_and_type_index \{
   . = constant_pool_counter
   constant_pool_counter = constant_pool_counter + 1
   u1 9
   u2 class_index
   u2 name_and_type_index
 \}

 struc constant_methodref class_index,name_and_type_index \{
   . = constant_pool_counter
   constant_pool_counter = constant_pool_counter + 1
   u1 10
   u2 class_index
   u2 name_and_type_index
 \}

 struc constant_interfacemethodref class_index,name_and_type_index \{
   . = constant_pool_counter
   constant_pool_counter = constant_pool_counter + 1
   u1 11
   u2 class_index
   u2 name_and_type_index
 \}

 struc constant_nameandtype name_index,descriptor_index \{
   . = constant_pool_counter
   constant_pool_counter = constant_pool_counter + 1
   u1 12
   u2 name_index
   u2 descriptor_index
 \}

}

macro end_constant_pool {
 constant_pool_count = constant_pool_counter
 restruc constant_utf8,constant_integer,constant_float,constant_long,constant_double
 restruc constant_class,constant_string
 restruc constant_fieldref,constant_methodref,constant_interfacemethodref,constant_nameandtype
}

macro interfaces {
 u2 interfaces_count
 interfaces_counter = 0
 macro interface interface \{
   interfaces_counter = interfaces_counter + 1
   u2 interface
 \}
}

macro end_interfaces {
 interfaces_count = interfaces_counter
 purge interface
}

macro attributes {
 local count,counter
 attributes_count equ count
 attributes_counter equ counter
 u2 attributes_count
 attributes_counter = 0
 macro attribute attribute_name_index \{
   attributes_counter = attributes_counter + 1
   u2 attribute_name_index
   local start,length
   attribute_start equ start
   attribute_length equ length
   u4 attribute_length
   attribute_start = $
 \}
 macro end_attribute \{
   attribute_length = $ - attribute_start
   restore atribute_start,attribute_length
 \}
}

macro end_attributes {
 attributes_count = attributes_counter
 restore attributes_count,attributes_counter
 purge attribute
}

macro fields {
 u2 fields_count
 fields_counter = 0
 macro field_info access_flags,name_index,descriptor_index \{
   fields_counter = fields_counter + 1
   u2 access_flags
   u2 name_index
   u2 descriptor_index
   attributes
 \}
 macro end_field_info \{ end_attributes \}
}

macro end_fields {
 fields_count = fields_counter
 purge field_info,end_field_info
}

macro methods {
 u2 methods_count
 methods_counter = 0
 macro method_info access_flags,name_index,descriptor_index \{
   methods_counter = methods_counter + 1
   u2 access_flags
   u2 name_index
   u2 descriptor_index
   attributes
 \}
 macro end_method_info \{ end_attributes \}
}

macro end_methods {
 methods_count = methods_counter
 purge method_info,end_method_info
}

macro bytecode {
 local length
 bytecode_length equ length
 u4 bytecode_length
 bytecode_offset = $
 org 0
}

macro end_bytecode {
 bytecode_length = $
 org bytecode_offset+bytecode_length
 restore bytecode_length
}

macro exceptions {
 local length
 exception_table_length equ length
 u2 exception_table_length
 exception_counter = 0
 macro exception start_pc,end_pc,handler_pc,catch_type \{
   exception_counter = exception_counter + 1
   u2 start_pc
   u2 end_pc
   u2 handler_pc
   u2 catch_type
 \}
}

macro end_exceptions {
 exception_table_length = exception_counter
 restore exception_table_length
}

include 'bytecode.inc'



include 'jclass.inc'

format binary as 'class'

 u4 0xcafebabe ; magic
 u2 0,49 ; minor and major version

 constant_pool

_Code constant_utf8 'Code'
_init constant_utf8 '<init>'
_main constant_utf8 'main'
_void_arrstr constant_utf8 '([Ljava/lang/String;)V'
Test_class constant_class _Test
_Test constant_utf8 'Test'

Object_init constant_methodref Object_class,init_method
Object_class constant_class _Object
_Object constant_utf8 'java/lang/Object'
init_method constant_nameandtype _init,_void
_void constant_utf8 '()V'

System.out constant_fieldref System_class,out_field
System_class constant_class _System
_System constant_utf8 'java/lang/System'
out_field constant_nameandtype _out,PrintStream_type
_out constant_utf8 'out'
PrintStream_type constant_utf8 'Ljava/io/PrintStream;'

PrintStream_println constant_methodref PrintStream_class,println_method
PrintStream_class constant_class _PrintStream
_PrintStream constant_utf8 'java/io/PrintStream'
println_method constant_nameandtype _println,_void_str
_println constant_utf8 'println'
_void_str constant_utf8 '(Ljava/lang/String;)V'

Integer_toString constant_methodref Integer_class,toString_method
Integer_class constant_class _Integer
_Integer constant_utf8 'java/lang/Integer'
toString_method constant_nameandtype _toString,_str_int
_toString constant_utf8 'toString'
_str_int constant_utf8 '(I)Ljava/lang/String;'

Hello constant_string _main ; re-use some existing UTF-8 sequences
Hello_again constant_string _void_arrstr ; for demonstration purposes
number constant_integer 1234

 end_constant_pool

 u2 ACC_PUBLIC+ACC_SUPER ; access flags
 u2 Test_class ; this class
 u2 Object_class ; super class

 interfaces

 end_interfaces

 fields

 end_fields

 methods

    method_info ACC_PUBLIC, _init, _void ; public void Test()

      attribute _Code

u2 1 ; max_stack
u2 1 ; max_locals

bytecode

aload 0
invokespecial Object_init
return

end_bytecode

exceptions
end_exceptions

attributes
end_attributes

      end_attribute

    end_method_info

    method_info ACC_PUBLIC+ACC_STATIC, _main, _void_arrstr ; public static void main(String[] args)

      attribute _Code

u2 3 ; max_stack
u2 1 ; max_locals

bytecode

getstatic System.out ; load value of System.out on top of the stack
dup ; duplicate, we are going to use it twice
ldc Hello
invokevirtual PrintStream_println
ldc Hello_again
invokevirtual PrintStream_println

return

end_bytecode

exceptions
end_exceptions

attributes
end_attributes

      end_attribute

    end_method_info

 end_methods

 attributes

 end_attributes