[TALLER] Aprende ASM y a depurar tu programa.

fary · 18 Febrero 2016, 20:51 PM

Uno de los grandes problemas que tuve al aprender ASM fue que yo venia de un lenguaje de alto nivel, debido a esto tuve muchos problemas para aprender a programar en este lenguaje, ya que para depurarlo no me servia un típico Msgbox. Por eso y por que hay una serie de usuarios que se quieren iniciar en este maravilloso lenguaje me he animado a ir escribiendo esto, con el fin de que puedan tener una base para realizar sus programas.

Este texto trabajará sobre Windows y para aplicaciones de 32 bits. También decir que se utilizará Flat Assembler, que es Open Source y gratuito, puedes obtener su ultima versión aquí:

http://flatassembler.net/download.php

Dicho esto, comencemos.

VARIABLES Y REGISTROS.

En ensamblador no existen las variables de tipo int, long, string y etc. Las variables pueden ser DWORD (4 bytes), WORD (2 bytes) o BYTE (1 byte).

Una variable de tipo DWORD se declara así:

Código (asm) [Seleccionar]

mivariable dd 0

Donde mivariable es el nombre que le damos a la variable, con el dd de indicamos que es un DWORD y el 0 indica que le damos como valor inicial un valor nulo, osea, cero.

La declaración para un WORD:

Código (asm) [Seleccionar]

mivariable dw 0

y para el BYTE:

Código (asm) [Seleccionar]


mivariable db 10

Con el 10 le indicamos que es una variable con tamaño de 10 bytes.

Luego estan los registros del microprocesador, que són los siguientes:

- EAX
- EBX
- ECX
- EDX

Los registros tienen un tamaño de 4 bytes ya que estamos programando para 32 bits.

Los podrémos usar como punteros o para almacenas información (que no supere los 4 bytes).

Estos 4 registros son de uso general, es decir son los guerreros a pie de nuestro programa. Con ellos podremos mover información de unas variables a otras, recibir el retorno de las funciones del sistema o realizar operaciónes como multiplicar o dividir.

Además de esos 4 registros también tenemos los registros EDI y ESI. Estos registros los podemos usar también como los anteriores, aunque su propósito es otro. Normalmente complementan algunas intrucciones. También se verá mas adelante su utilidad.

Los registros EBP y ESP son los que indican la parte baja y la parte alta de la pila, que se explicará a continuación.

Y por último el registro EIP, este es el que indica la posición en memoria de la instrucción que se esta ejecutando. Cuando depuremos nuestra aplicación mas adelante veremos su uso.

Como aclaración decir que todos los registros tienen una capacidad de 4 bytes.

LA PILA

La pila es una "estructura", en la que almaceramos información para pasarle argumentos a nuestras funciones. Para que lo entendaís mejor, si yo quiero llamar a la API MessageBoxA lo que haré será meter sus 4 parametros en la pila y entonces llamar a la función.

La pila tiene una base, que la indica el registro EBP y una parte alta, que la indica el registro ESP.

Cada vez que introducimos un valor en la pila el registro ESP decrementa en 4. Este registro tiene que estar siempre estable ya que si no es así nuestra aplicación estallará.

Aquí entran en juego las convenciones de llamada. Esta el tipo stdcall, que es el que usa Windows y el cdecl, que lo usan algunas librerías como las de C.

En el caso de que la llamada sea de tipo stdcall NO tenemos que restaurar el registro ESP, ya que lo hace la propia función, sin embargo si es cdecl, si la tendremos que restaurar. Un ejemplo es si a la función printf de C de pasamos dos argumentos, tendremos que sumar al registro ESP 8 bytes, ya que cada argumento ocupa 4 bytes.

Y bueno, sobre este tema decir poco más, creo que es suficiente para entender el concepto.

EL JUEGO DE INSTRUCCIONES.

MOV Mueve datos entre variables y registros, unos ejemplos de su uso:

Código (asm) [Seleccionar]


mov eax, edx ; Mueve el contenido del registro EDX al registro EAX
mov [mivariable], eax ; mueve el contenido de EAX a la variable "mivariable"

No se permiten mover datos entre variables, con lo cual

Código (asm) [Seleccionar]

mov [mivariable], [otravariable]

no es valido, para hacer eso tendríamos que mover el valor de "otravariable" a un registro y luego mover el registro a "mivariable".

NOTA: con el caracter ";" se ponen comentarios en el código
NOTA 2: los corchetes [] indican que lo que queremos es acceder al valor de la variable, no al puntero.

ADD con esta intruccion se realizan operaciones de suma, ejemplos de uso:

Código (asm) [Seleccionar]


add eax, 10 ; se suma al valor que contenga EAX 10.
add [mivariable], 5; se le suma al valor de la variable 10

Código (asm) [Seleccionar]

SUB al igual que ADD suma, SUB resta, su uso es igual.

INC incrementa el valor de la variable o registro en 1, ejemplos:

Código (asm) [Seleccionar]

inc eax ; incrementa el valor de EAX en 1
inc [mivariable] ; incrementa el valor de mivariable en 1

DEC decrementa el valor, su uso es similar a inc.

MUL instrucción para multiplicar, esta instrución funciona de la siguiente manera:

Código (asm) [Seleccionar]

mov [mivariable], 2
mov eax, 2
mul [mivariable] ; Multiplica 2*2.
; resultado en el registro EAX y EDX

NOTA: el registro EDX debe valer 0 a la hora de multiplicar.

DIV instrucción que se usa para dividir, funciona de la sigueinte manera:

Código (asm) [Seleccionar]

mov [var], 2
mov eax, 10
div [var]
; EAX = resultado
; EDX = residuo

EDX tiene que valer 0 antes de realizar la operación.

push introduce un valor en la pila.

Código (asm) [Seleccionar]

push eax
push [mivar]

pop saca un valor de la pila.

pop eax ; el valor que contenia la pila ahora lo tiene EAX
pop [mivar] ; el valor que contenia la pila ahora lo tiene mivar

jmp salto hacia una parte del código, ejemplo:

Código (asm) [Seleccionar]

mov eax, 1
jmp Etiqueta ; saltamos
mov eax, 2 ; esto no se ejecuta
Etiqueta:
; EAX = 1

ret retorna una función, como return en C.

Código (asm) [Seleccionar]

...
...
add esp, 12
ret

cmp esta instrucción compara dos valores es el if del ASM, para usarla se necesitan otras intrucciones complementarias, estas son algunas:

je salta a a una etiqueta si los valores son iguales
jne salta a una etiqueta si los valores NO son iguales

Entre otras, que podemos ver aquí:

Código [Seleccionar]

http://www.jegerlehner.ch/intel/IntelCodeTable.pdf

Ejemplo de uso:

Código (asm) [Seleccionar]

cmp eax, edx
je Iguales 
mov eax,0
ret
Iguales:
mov eax,1
ret

Si los valores son iguales devolvera 1, si no, devolvera 0.

xor realiza un xor, como en cualquier otro lenguaje, ejemplo.

Código (asm) [Seleccionar]

xor eax, edx

el resultado de la operación se guarda en el primer parametro de la instrucción, en este caso EAX

and operación aritmética, ej:

Código (asm) [Seleccionar]

and ebx, ecx

El resultado se obtiene tambien en el primer parametro, en este caso EBX

or operación aritmética, se usa igual que las dos anteriores.

ESTRUCTURA DEL CÓDIGO.

Una vez explicadas las intrucciones básicas vamos a explicar la estructura de los códigos en FASM.

Dejar claro que en ASM no es recomendable, no se puede (se puede pero no se debé) mezclar las variables con el código. La estructura es extrícta. Para generar un ejecutable podemos usar las siguientes estructuras:

Código (asm) [Seleccionar]

include 'win32ax.inc'

.data
        ; AQUI VAN LAS VARIABLES
.code
start:

        ; AQUI EL CODIGO

        ; AL FINALIZAR EL CODIGO PODEMOS DECLARAR MAS VARIABLES.

.end start

Ó de esta otra forma:

Código (asm) [Seleccionar]

include 'win32ax.inc'
entry start


section '.data' readable writeable
        ; AQUI VAN LAS VARIABLES

section '.code' executable readable writeable
start:
        ; AQUI EL CODIGO

        ; AL FINALIZAR EL CODIGO PODEMOS DECLARAR MAS VARIABLES.

section '.idata' import data readable writeable

        ; AQUI VAN LAS IMPORTACIONES DE LAS FUNCIONES QUE VAMOS A USAR.

Un ejemplo de un programa que muestra un mensaje con MessageBoxA.

Código (asm) [Seleccionar]

include 'win32ax.inc' ; incluimos la librería para podes usar las macros SECTION, LIBRARY y ETC.
entry start


section '.data' readable writeable ; sección de datos
        Mensaje          db 'Hola dese FASM!',0  ; debemos poner el byte nulo '0', para que sea una cadena.

section '.code' executable readable writeable ; sección de codigo
start:

        push 0   ; metemos el último parametro de la api
        push Titulo ; metemos el 3 parametro
        push Mensaje ; metemos el 2 parametro
        push 0        ; metemos el 1 parametro
        call [MessageBoxA]  ; llamamos a la API.

        ret ; retornamos la funcion. Se acbaa el programa.

        Titulo          db 'ElHacker.net',0
section '.idata' import data readable writeable ; tabla de importaciones

        library USER32, 'USER32.DLL'  ; librería donde se encuentra la API


        import USER32,\
               MessageBoxA, 'MessageBoxA' ; Función que vamos a usar

Resultado:

Como podemos observar, para llamar a una función hay que introducir los parametros en la pila, estos parametros deben ir al revez, ya que la pila en una estructura de tipo LIFO.

Código [Seleccionar]


https://es.wikipedia.org/wiki/Last_in,_first_out

Ahora imaginemonos que queremos realizar una suma y mostrar el resultado en el mensaje.

Tenemos estad dos variables:

Código (asm) [Seleccionar]

Num1    dd 2
Num2    dd 3

Lo mas fácil es hacer esto:

Código (asm) [Seleccionar]

mov eax, [Num1]
add eax, [Num2]

push 0
push 0
push eax
push 0
call [MessageBoxA]

Sin embargo, si probamos vamos a ver que no funciona... esto se debe a que un número no es lo mismo que una cadena. En lenguajes de de alto nivel si que funcionaría, porque el compilador/interprete realiza este paso por tí.

Para poder imprimirlo deberíamos de pasarlo a cadena, bién con una funcion que implementemos nosotros ó usando algúna del sistema como por ejemplo wsprintfA.

Bueno, esto es solo un apunte puntual, sigamos...

CONOCIENDO MEJOR LOS REGISTROS: BYTES, WORD y DWORD.

Cuando explique los registros no lo dije, pero los registros de proposito general se pueden descomponer a su vez en registros de menor tamaño.

Ya sabemos que al programar para 32 bits los registros ocupan 4 bytes, pero también podemos usar los registros de 16 y 8 bits...

Por ejemplo, el registro EAX es la extension de AX, que es el registro de 16 bits y este otro se divide a su vez en dos registros de 1 byte, AH (que esta en la parte alta) y AL (que esta en la parte baja)

Además podemos acceder a cualquier byte, word o dword de la siguiente forma:

Para obtener un byte de una variable o registro:

Código (asm) [Seleccionar]

; Suponiendo que en la variable buffer tenemos la cadena 'hola'

mov al, byte[buffer]  ; AL = 'h'
mov ah, byte[buffer+1] ; AH = 'o'

mov al, byte[ecx] ; mueve el byte al que apunta ECX a AL.

Lo mismo pasa con los WORD:

Código (asm) [Seleccionar]


mov DX, word[buffer]

Y los DWORD:

Código (asm) [Seleccionar]

mov eax, DWORD[buffer]
mov eax, [buffer] ; esto es igual a la linea anterior

BUCLES y IF.

En ASM, no existen bucles for, while ni nada por el estilo, los bucles se hacen con contadores.

Por ejemplo un bucle infinito sería esto:

Código (asm) [Seleccionar]


Bucle:
push 0 ; estamos dentro del bucle.
push 0
push 0
push 0
call [MessageBoxA]
jmp Bucle ; saltamos a la etiqueta bucle de nuevo.

Para intentar hacer un bucle for que se ejecuta 5 veces tendríamos que hacer esto:

Código (asm) [Seleccionar]

include 'win32ax.inc' ; incluimos la librería para podes usar las macros SECTION, LIBRARY y ETC.

.data
        var     dd 5
        Texto   db 'Esto se mostrara 5 veces.',0
.code
start:
        mov ecx, [var] ; movemos el valor de la variable a ECX

        Bucle:
                push ecx  ; guardamos el valor de ECX

                push 0
                push 0
                push Texto
                push 0
                call [MessageBoxA] ; llamamos a la API

                pop ecx ; Recuperamos el valor de ECX

                dec ecx ; decrementamos el valor de ECX
                cmp ecx, 0 ; Comparamos ECX con 0
                jne Bucle ; Si la comparación no es igual saltamos de nuevo a la etiqueta bucle
        ret ; retornamos la funcion y terminamos el programa.
.end start

Pero... Porque guardamos el registro ECX antes de llamar a la API?

Resputa: Nomalmente TODAS las funciones de windows devuelven su valor en el registro EAX y solo modifican este registro despues de llamar a la función, pero en este caso la API MessageBoxA también modifica ECX, con lo cual en ECX ya no tendríamos nuestro contador $:-\$ por eso el push y pop con ECX, para guardar su valor y despues recuperarlo intacto.

Para hacer un IF en ASM tendríamos que usar la intrucción CMP, ya se ha mostrado su uso.

FUNCIONES

Para crear una función tenemos que recordar que los parametros se pasan a traves de la pila.

Lo primero para escribir el código de nuestra función es escribir una etiqueta y usar los registros ESP y EBP para acceder los parametros que hemos introducido anteriormente en la pila.

Ej:

Código (asm) [Seleccionar]

include 'win32ax.inc' ; incluimos la librería para podes usar las macros SECTION, LIBRARY y ETC.

.data
        var     dd 5
        Texto   db 'Este mensaje se ejecuta desde la funcion',0
        Titulo  db 'ElHacker.net',0
.code
start:

        push Texto
        push Titulo
        call Mensaje

        ret

        Mensaje: ; Funcion mensage.
            push ebp ; Guardamos la base de la pila
            mov ebp, esp ; movemos la parte alta de la pila a la parte baja.

            mov eax, dword[ebp+8] ; movemos el primer parametro a EAX
            mov ebx, dword[ebp+12] ; segundo parametro a EBX

            push 0 ; introducimos los parametros d ela API
            push eax
            push ebx
            push 0
            call [MessageBoxA] ; llamamos a la API

            pop ebp ; restauramos el valor de EBP
            add esp,12 ; se restaura el registro para que no se rompa la pila
            ret

.end start

Para entender mejor el código antes de nada diré que la intrucción CALL lo que hace es introducir el valor de retorno en la pila, osea la siguiente intrucción del call para que luego el SO sepa a donde debé saltar al retornar la función.

Debido a esto para restaurar la pila hay que sumar 12 y no 8.

Código (asm) [Seleccionar]

add esp,12

Ya que son 2 parametros: 2 x 4 bytes que ocupan los punteros = 8
8 + 4 del valor de retorno cuando acabe la API = 12.

Si pasaramos 4 parametros seria 4 x 4 = 16
16 + el retorno = 20, tendriamos que sumar 20 a ESP.

Código (asm) [Seleccionar]

mov eax, dword[ebp+8] ; movemos el primer parametro a EAX
mov ebx, dword[ebp+12] ; segundo parametro a EBX

Aquí, ocurre lo mismo por la dirección de retorno, el primer parametro se encuentra a la posicion 8 el segundo en la 12 y si metieramos mas parametros se encontrarián sumando de 4 en 4 osea:

dword[ebp+16] ; tercer parametro
dword[ebp+20] ; cuarto parametro
....
....

En fin, así funciona la cosa de las funciones, cualquier duda preguntar.

OllyDbg y la depuración de nuestro programa.

La aplicación la podemos descargar gratuitamente desde aquí:

http://www.ollydbg.de/download.htm

Una vez descargada la ejecutamos y vamos a File > Open y abrimos cualquier ejecutable.
Una vez hecho esto el Olly nos deja situados en el EntryPoint del programa es decir, la primera instrucción que se ejecuta del programa.

La utilización de esta herramienta para depuración es simple porque nosotros conocemos como esta programado nuestro ejecutable pero para depurar programas que no hemos creado nosotros puede resultas lioso y complicado, no obstante como nosotros solo queremos depurar y ver como funciona no nos resultará complicado.

Ahora bién, veamos sus partes:

En el punto 1: Vemos las instrucciónes del programa, los opcodes de la instrucción y la dirección en memoria, ejemplo:

Código [Seleccionar]

0040102A |. 09C0 OR EAX,EAX

0040102A -> Es la posición en memoria.
09C0 -> Opcodes de la instrucción
OR EAX,EAX -> instrucción

Punto 2: vemos los valores de los registros. Los valores del registro iran cambiando conforme vamos ejecutando instrucciones (siempre y cuando la instrucción modifique algun registro, si no se quedan como estaban)

Punto 3: El ejecutable dumpeado.
Punto 4: La pila, en el veremos los datos que se introducen en la pila y el valo rque contiene.

AHora bién veremos como se maneja el programa, para ello vamos a ensamblar un ejemplo que pusimos anteriormente:

Código (asm) [Seleccionar]

include 'win32ax.inc' ; incluimos la librería para podes usar las macros SECTION, LIBRARY y ETC.
 
.data
        var     dd 5
        Texto   db 'Esto se mostrara 5 veces.',0
.code
start:
        mov ecx, [var] ; movemos el valor de la variable a ECX
 
        Bucle:
                push ecx  ; guardamos el valor de ECX
 
                push 0
                push 0
                push Texto
                push 0
                call [MessageBoxA] ; llamamos a la API
 
                pop ecx ; Recuperamos el valor de ECX
 
                dec ecx ; decrementamos el valor de ECX
                cmp ecx, 0 ; Comparamos ECX con 0
                jne Bucle ; Si la comparación no es igual saltamos de nuevo a la etiqueta bucle
        ret ; retornamos la funcion y terminamos el programa.
.end start

Lo ensamblamos y lo cargamos en el olly. Como es un programa pequeñito vamos a ver poca cosa

, el ASM que vemos es este:

Bién, ahora vamos a ver como depurarlo:

-Si pulsamos F9, nuestro programa correra fluidamente, es decir, como si lo estuvieramos ejecutando.
-Si pulsamos F8 vamos a ejecutar una sola instrucción.
- Si pulsamos F7 se va a ejecutar una intruccion como en F8 pero con la diferencia de que si lo pulsamos sobre una instrucción CALL entraremos en la función (con F8 esto no sucede).
-Si pulsamos F2 pondremos un BreakPoint en la instruccion que tenemos selecionada. Es decir, si ponemos un BP y pulsamos F9 el programa se ejecutara hasta llegar a la instrucción a la que le pusimos en BP (BreackPoint).

Para comprobar el funcionamiento podemos ir probando por ejemplo si ponemos un BP en esta linea:

Código (asm) [Seleccionar]

0040201D |.^75 E7 \JNZ SHORT Tutorial.00402006

Y pulsamos F9, el programa se nos parara ahí, si lo volvemos a pulsar se nos volvera a parar, así hasta 5 veces, que son las veces que se ejecuta esa instrucción ( recordemos que es un bucle).

Vamos a probar mas cosas. En el programa vemos que guardamos ECX, pero... porque?

Bien si quitamos el push ecx y pop ecx del programa lo ensamblamos y abrimos con Olly lo vamos a ver:

Tenemos eso en el Olly y ahora vamos a ir ejecutando instrucción a instrucción pulsando F8. Pulsamos F8 hasta llegar a la llamada a MessageBox, aquí:

Código (asm) [Seleccionar]

00402011  |. FF15 3C304000  |CALL DWORD PTR DS:[<&USER32.MessageBoxA>; \MessageBoxA

Entonces miramos el valor del registro ECX:

Si pulsamos una vez mas F8 vamos a ver que el valor de ECX cambia

y el bucle se va a romper... el programa estallara, por eso lo de guardar el valor de ECX.
Con esto quería mostrar que a veces las llamadas a las API pueden modificar los registros y nos pueden volver loco buscando el error si no andamos con cuidado.

En fin, con este poquito que hemos visto de OllyDbg podemos depurar nuestro programa, Si quereis indagar mas sobre este Software teneis miles de tutoriales en la web de Ricardo Narvaja:

www.ricardonarvaja.info

Creo que con esto acabo de tutorial de momento ya que creo que se puede tener una visión general de lo que va el tema.

un saludo y espero que ha alguien le haya ayudado!

crack81 · 19 Febrero 2016, 01:55 AM

Lindo tuto fary te animo a continuarlo

saludos...

Arnaldo Otegi · 19 Febrero 2016, 04:17 AM

Mui buen post fary se agradece las ganas que pones por intentar enseñar y ayudar a la gente.

fary · 25 Febrero 2016, 22:30 PM

He escrito un poquito mas

TomaSs · 2 Marzo 2016, 04:20 AM

Se agradece mucho tus ganas de enseñar

Mil gracias!

fary · 2 Marzo 2016, 07:58 AM

Cita de: TomaSs en 2 Marzo 2016, 04:20 AM
Se agradece mucho tus ganas de enseñar

Mil gracias!

Hola Tomas,

Puedes seguir el tema, lo iré acabando conforme valle teniendo tiempo.

Saludos.

Arnaldo Otegi · 2 Marzo 2016, 21:07 PM

Mui buen post,se agradece.
saludos.

fary · 19 Marzo 2016, 09:13 AM

Creo que lo doy por terminado porque se podría escribir un libro sobre esto. Con esto de puede tener una base/idea de como programar y depurar de forma basica un software y encontrar nuestros errores.

saludos.

Pablo Videla · 30 Marzo 2016, 22:22 PM

Muchas gracias Fary.

.:UND3R:. · 31 Marzo 2016, 22:26 PM

Cita de: Pablo Videla en 30 Marzo 2016, 22:22 PM
Muchas gracias Fary.

Muy recomendado señor, sobre todo para usted

Fary, excelente aporte, saludos