Sucesion de Fibonacci recursiva optimizada

eferion · 22 Julio 2013, 07:13 AM

Cita de: rir3760 en 21 Julio 2013, 19:17 PM
En el desplazamiento si la variable es de un tipo entero con signo el valor del bit de relleno depende de la implementación, en otras palabras no esta garantizado que el resultado de ambas operaciones (división y desplazamiento) sea el mismo

Tenía entendido que en el caso de los procesadores empleados en PCs... intel, amd, etc... si se da esa condición.

do-while · 22 Julio 2013, 09:28 AM

¡Buenas!

Había leido que de las operaciones "elementales" (+, -, * , / y %), las que mas le costaban al procesador eran / y %, la división, y efectivamente:

Código (c) [Seleccionar]


#include <stdio.h>
#include <stdlib.h>
#include <time.h>

#define MAX 10000000000LLU

int main(int argc, char *argv[])
{
    unsigned long long i,x,y;
    time_t ini;

    ini = time(NULL);

    for(i = 0 ; i < MAX ; i++)
        if(i % 2);

    printf("%lu segundos\n", time(NULL) - ini);

    ini = time(NULL);

    for(i = 0 ; i < MAX ; i++)
        if(i & 1);

    printf("%lu segundos\n", time(NULL) - ini);

    return 0;
}

Se nota la diferencia, pero para que sea considerable, he tenido que llegar a 10^10 iteraciones...

Aun así, se ve que es preferible comprobar el bit menos significativo en un código que requiera continuamente la comprobación de la paridad de un numero a utilizar el operador módulo.

¡Saludos!

eferion · 22 Julio 2013, 10:08 AM

Cita de: do-while en 22 Julio 2013, 09:28 AM
Se nota la diferencia, pero para que sea considerable, he tenido que llegar a 10^10 iteraciones...

Está claro que, pese a ser más pesada, una operación de división está lo suficientemente optimizada ( al menos cuando se manejan números enteros ) como para no ser un lastre excesivo... salvo que estés en un entorno de tiempo real crítico.

Lo que sí está claro es que, sobretodo en el caso de bucles con un gran número de repeticiones, las pequeñas optimizaciones se van notando cada vez más... obviamente hacer una sustitución así en, por ejemplo, una función que se ejecuta una vez cada vez que un usuario hace click sobre un botón no es una mejora a la que el vayas a sacar partido realmente.

La siguiente mejora que podrías plantearte en este código es el que sea capaz de manejar números realmente grandes... de 100, 200 ... 1000 cifras.

Funciones matemáticas optimizadas y con opción a manejar números grandes... más sus optimizaciones para números enteros normales, sería una buena base para sacar una librería matemática interesante.

amchacon · 22 Julio 2013, 10:43 AM

Cita de: do-while en 22 Julio 2013, 09:28 AMSe nota la diferencia, pero para que sea considerable, he tenido que llegar a 10^10 iteraciones...

Tú código no es correcto para cualquier compilador actual, mi compilador directamente se salta los fors y los ifs porque los considera que son inútiles. La prueba está en que los fors no aparecen en el código ensamblador:

Código (asm) [Seleccionar]

.file "main.cpp"
 .def __main; .scl 2; .type 32; .endef
 .section .rdata,"dr"
.LC0:
 .ascii "%lu segundos\12\0"
 .section .text.startup,"x"
 .p2align 4,,15
 .globl main
 .def main; .scl 2; .type 32; .endef
 .seh_proc main
main:
.LFB49:
 pushq %rsi
 .seh_pushreg %rsi
 pushq %rbx
 .seh_pushreg %rbx
 subq $40, %rsp
 .seh_stackalloc 40
 .seh_endprologue
 call __main
 movq __imp__time64(%rip), %rbx
 xorl %ecx, %ecx
 call *%rbx
 xorl %ecx, %ecx
 movq %rax, %rsi
 call *%rbx
 leaq .LC0(%rip), %rcx
 movq %rax, %rdx
 subq %rsi, %rdx
 call printf
 xorl %ecx, %ecx
 call *%rbx
 xorl %ecx, %ecx
 movq %rax, %rsi
 call *%rbx
 leaq .LC0(%rip), %rcx
 movq %rax, %rdx
 subq %rsi, %rdx
 call printf
 xorl %eax, %eax
 addq $40, %rsp
 popq %rbx
 popq %rsi
 ret
 .seh_endproc
 .ident "GCC: (rev1, Built by MinGW-builds project) 4.8.1"
 .def printf; .scl 2; .type 32; .endef

Lo modifique tal que así:

Código (cpp) [Seleccionar]

#include <stdio.h>
#include <stdlib.h>
#include <time.h>

#define MAX 5000000000LLU

int main(int argc, char *argv[])
{
    unsigned long long i;
    unsigned int Contador = 0;
    time_t ini;

    ini = time(NULL);

    for(i = 0 ; i < MAX ; i++)
       Contador += i% 2;

    printf("%lu segundos\n", time(NULL) - ini);

    ini = time(NULL);

    for(i = 0 ; i < MAX ; i++)
        Contador -= i&1;

    printf("%lu segundos\n", time(NULL) - ini);

     printf("%d",Contador);

    return 0;
}

Ahora si que se nota que hace las operaciones, aunque haciendo pruebas. Me di cuenta que ambas operaciones dependían más del factor suerte que de otra cosa (a veces ganaba uno, otra veces ganaba otro y otras veces empataban). Analizando el código ASM:

Código (asm) [Seleccionar]

 .file "main.cpp"
 .def __main; .scl 2; .type 32; .endef
 .section .rdata,"dr"
.LC0:
 .ascii "%lu segundos\12\0"
.LC1:
 .ascii "%d\0"
 .section .text.startup,"x"
 .p2align 4,,15
 .globl main
 .def main; .scl 2; .type 32; .endef
 .seh_proc main
main:
.LFB49:
 pushq %rdi
 .seh_pushreg %rdi
 pushq %rsi
 .seh_pushreg %rsi
 pushq %rbx
 .seh_pushreg %rbx
 subq $32, %rsp
 .seh_stackalloc 32
 .seh_endprologue
 xorl %ebx, %ebx
 call __main
 movq __imp__time64(%rip), %rsi
 xorl %ecx, %ecx
 call *%rsi
 xorl %edx, %edx
 movabsq $5000000000, %r8
 movq %rax, %rdi
 .p2align 4,,10
.L3:
 movl %edx, %ecx
 addq $1, %rdx
 andl $1, %ecx
 addl %ecx, %ebx
 cmpq %r8, %rdx
 jne .L3
 xorl %ecx, %ecx
 call *%rsi
 leaq .LC0(%rip), %rcx
 movq %rax, %rdx
 subq %rdi, %rdx
 call printf
 xorl %ecx, %ecx
 call *%rsi
 xorl %edx, %edx
 movabsq $5000000000, %r8
 movq %rax, %rdi
 .p2align 4,,10
.L5:
 movl %edx, %ecx
 addq $1, %rdx
 andl $1, %ecx
 subl %ecx, %ebx
 cmpq %r8, %rdx
 jne .L5
 xorl %ecx, %ecx
 call *%rsi
 leaq .LC0(%rip), %rcx
 movq %rax, %rdx
 subq %rdi, %rdx
 call printf
 leaq .LC1(%rip), %rcx
 movl %ebx, %edx
 call printf
 xorl %eax, %eax
 addq $32, %rsp
 popq %rbx
 popq %rsi
 popq %rdi
 ret
 .seh_endproc
 .ident "GCC: (rev1, Built by MinGW-builds project) 4.8.1"
 .def printf; .scl 2; .type 32; .endef

Podemos identificar los dos fors aquí:

Código (asm) [Seleccionar]

.L3:
 movl %edx, %ecx
 addq $1, %rdx
 andl $1, %ecx
 addl %ecx, %ebx
 cmpq %r8, %rdx
 jne .L3

Código (asm) [Seleccionar]

.L5:
 movl %edx, %ecx
 addq $1, %rdx
 andl $1, %ecx
 subl %ecx, %ebx
 cmpq %r8, %rdx
 jne .L5

Fijate que el compilador lo ha optimizado haciendo las mismas operaciones en los dos casos. Es curioso que incluso desactivando la optimización del compilador, tenemos las mismas operaciones en el for:

Código (asm) [Seleccionar]

 .file "main.cpp"
 .def __main; .scl 2; .type 32; .endef
 .section .rdata,"dr"
.LC0:
 .ascii "%lu segundos\12\0"
.LC1:
 .ascii "%d\0"
 .text
 .globl main
 .def main; .scl 2; .type 32; .endef
 .seh_proc main
main:
.LFB36:
 pushq %rbp
 .seh_pushreg %rbp
 movq %rsp, %rbp
 .seh_setframe %rbp, 0
 subq $64, %rsp
 .seh_stackalloc 64
 .seh_endprologue
 movl %ecx, 16(%rbp)
 movq %rdx, 24(%rbp)
 call __main
 movl $0, -12(%rbp)
 movl $0, %ecx
 call time
 movq %rax, -24(%rbp)
 movq $0, -8(%rbp)
 jmp .L2
.L3:
 movq -8(%rbp), %rax
 andl $1, %eax
 addl %eax, -12(%rbp)
 addq $1, -8(%rbp)
.L2:
 movabsq $4999999999, %rax
 cmpq %rax, -8(%rbp)
 jbe .L3
 movl $0, %ecx
 call time
 subq -24(%rbp), %rax
 movq %rax, %rdx
 leaq .LC0(%rip), %rcx
 call printf
 movl $0, %ecx
 call time
 movq %rax, -24(%rbp)
 movq $0, -8(%rbp)
 jmp .L4
.L5:
 movq -8(%rbp), %rax
 andl $1, %eax
 subl %eax, -12(%rbp)
 addq $1, -8(%rbp)
.L4:
 movabsq $4999999999, %rax
 cmpq %rax, -8(%rbp)
 jbe .L5
 movl $0, %ecx
 call time
 subq -24(%rbp), %rax
 movq %rax, %rdx
 leaq .LC0(%rip), %rcx
 call printf
 movl -12(%rbp), %eax
 movl %eax, %edx
 leaq .LC1(%rip), %rcx
 call printf
 movl $0, %eax
 addq $64, %rsp
 popq %rbp
 ret
 .seh_endproc
 .ident "GCC: (rev1, Built by MinGW-builds project) 4.8.1"
 .def time; .scl 2; .type 32; .endef
 .def printf; .scl 2; .type 32; .endef

Código (asm) [Seleccionar]

 jmp .L2
.L3:
 movq -8(%rbp), %rax
 andl $1, %eax
 addl %eax, -12(%rbp)
 addq $1, -8(%rbp)
.L2:
 movabsq $4999999999, %rax
 cmpq %rax, -8(%rbp)
 jbe .L3

Código (asm) [Seleccionar]

 jmp .L4
.L5:
 movq -8(%rbp), %rax
 andl $1, %eax
 subl %eax, -12(%rbp)
 addq $1, -8(%rbp)
.L4:
 movabsq $4999999999, %rax
 cmpq %rax, -8(%rbp)
 jbe .L5

Ergo, no. No hay diferencia entre % y & en un compilador actual.

eferion · 22 Julio 2013, 11:00 AM

La pregunta entonces es... ¿ Es aplicable ese resultado a cualquier compilador ?

Creo que habría entonces que hacer una batería de pruebas con diferentes compiladores, porque no creo que todos implementen las mismas optimizaciones...

Eso si... te lo has currado mirándote el código en ensamblador

do-while · 26 Julio 2013, 10:30 AM

amchacon, eres un tramposo...

Deja que los niños jueguen en igualdad de condiciones, que sino se sienten discriminados...

Código (c) [Seleccionar]

#include <stdio.h>
#include <stdlib.h>
#include <time.h>

#define MIN 37
#define MAX 42

typedef unsigned long long fibo_t;

unsigned long long llamadas_clasico;
unsigned long long llamadas_optimizado;

#define MAX_CACHE 33

unsigned long long Fibonaci_Cache[MAX_CACHE] = {1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987,1597
,2584,4181,6765,10946,17711,28657,46368,75025,121393,196418,317811,514229,832040,1346269,2178309,31524578};

fibo_t fibo_clasico(fibo_t n)
{
    llamadas_clasico++;

    if(n < MAX_CACHE)
        return Fibonaci_Cache[n];

    return fibo_clasico(n - 1) + fibo_clasico(n - 2);
}

fibo_t fibo(fibo_t n)
{
    llamadas_optimizado++;

    if(n < MAX_CACHE)
        return Fibonaci_Cache[n];

    if(n % 2) //n impar y mayor que 2
    {
        fibo_t k1,k2;

        k1 = fibo((n + 1) / 2);
        k2 = fibo((n - 1) / 2);

        return k1 * k1 + k2 * k2;
    }

    //n par y mayor que 2
    return fibo(n / 2) * (fibo((n / 2) + 1) + fibo((n / 2) - 1));
    //si n == 2 fibo(n / 2) * fibo(n / 2 + 1) = fibo(1) * fibo(2)
    //habria recursion infinita si no se pone n == 2 como caso base
}

int main(int argc, char *argv[])
{
    fibo_t i,valor;
    time_t ini;

    printf("Fibonacci clasico:\n");

    ini = time(NULL);

    for(i = MIN ; i < MAX ; i++)
    {
        llamadas_clasico = 0;
        valor = fibo_clasico(i);

        printf("  fibo_clasico(%llu) = %llu (%llu llamadas)\n",i,valor,llamadas_clasico);
    }

    printf("%llu segundos\n",time(NULL) - ini);

    printf("\nFibonacci optimizado:\n");

    ini = time(NULL);

    for(i = MIN ; i < MAX ; i++)
    {
        llamadas_optimizado = 0;
        valor = fibo(i);

        printf("  fibo(%llu) = %llu (%llu llamadas)\n",i,valor,llamadas_optimizado);
    }

    printf("%llu segundos\n",time(NULL) - ini);

    return 0;
}

¡Saludos!

Por cierto, ¿cómo has conseguido el código en ensamblador? Supongo que será alguna opción del compilador, pero nunca me he metido mucho a jugar con el, así que no se que opción has utilizado...

¡Saludos!

amchacon · 26 Julio 2013, 10:49 AM

Cita de: eferion en 22 Julio 2013, 11:00 AM
La pregunta entonces es... ¿ Es aplicable ese resultado a cualquier compilador ?

Creo que habría entonces que hacer una batería de pruebas con diferentes compiladores, porque no creo que todos implementen las mismas optimizaciones...

Seguramente las implementaciones varien de un compilador a otro, pero lo normal esque hagan estas optimizaciones automáticamente, si no esque estás usando un compilador-patata.

Cita de: do-while en 26 Julio 2013, 10:30 AM
amchacon, eres un tramposo...

Deja que los niños jueguen en igualdad de condiciones, que sino se sienten discriminados...

En las sucesiones lineales se pueden hacer muchas trampas

Seguramente en los juegos lo implementarán así, para ganar rendimiento.

Cita de: do-while en 26 Julio 2013, 10:30 AMPor cierto, ¿cómo has conseguido el código en ensamblador? Supongo que será alguna opción del compilador, pero nunca me he metido mucho a jugar con el, así que no se que opción has utilizado...

Hay que pasarle el flag -S al compilador.

Si usas un IDE como Codeblocks, se puede hacer la siguiente chapuzilla:

- Crea un proyecto de consola, pon el código y vete a Project -> build options -> other options. Escribir -S

Dale a reconstruir todo (control+F11). Al final dará un error (porque intentará linkar y verá que no puede

). Vete a la carpeta obj de tu proyecto y abre el archivo con el notepad.

do-while · 26 Julio 2013, 11:43 AM

¡Buenas!

Me acabo de dar cuenta de que el último valor del vector está mal. Se te ha colado un 1 entre el 3 y el 5. Te aviso por si vas a utilizar el código para otros programas, no vaya a ser que no te salgan los cálculos y te vuelvas loco buscando el origen de todo mal (a mi me ha pasado

) Aquí te dejo el vector correcto.

Código (c) [Seleccionar]


unsigned long long Fibonaci_Cache[MAX_CACHE] = {0,1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987,1597
,2584,4181,6765,10946,17711,28657,46368,75025,121393,196418,317811,514229,832040,1346269,2178309,3524578};

¡Saludos!

eferion · 29 Julio 2013, 13:47 PM

Cita de: amchacon en 26 Julio 2013, 10:49 AM
Seguramente las implementaciones varien de un compilador a otro, pero lo normal esque hagan estas optimizaciones automáticamente, si no esque estás usando un compilador-patata.

Yo solo me refería la hecho de que las optimizaciones comentadas fuesen equivalentes al menos en los compiladores más utilizados... ya que si alguno de éstos no es capaz de optimizar alguna de las posibilidades propuestas tal vez habría que optar por la opción B.

En cuanto a las optimizaciones automáticas... variarán en función de cómo configures la compilación... compilar con debug = 0 optimizaciones y de ahí hasta lo que te ofrezca el propio compilador... luego también puedes añadir flags para que las optimizaciones vayan en pro de la velocidad o en pro del consumo de memoria...

En fin, que yo creo que es malo generalizar en este tema.