Sucesion de Fibonacci recursiva optimizada

Iniciado por do-while, 20 Julio 2013, 14:11 PM

0 Miembros y 2 Visitantes están viendo este tema.

eferion

Cita de: rir3760 en 21 Julio 2013, 19:17 PM
En el desplazamiento si la variable es de un tipo entero con signo el valor del bit de relleno depende de la implementación, en otras palabras no esta garantizado que el resultado de ambas operaciones (división y desplazamiento) sea el mismo

Tenía entendido que en el caso de los procesadores empleados en PCs... intel, amd, etc... si se da esa condición.

do-while

¡Buenas!


Había leido que de las operaciones "elementales" (+, -, * , / y %), las que mas le costaban al procesador eran / y %, la división, y efectivamente:

#include <stdio.h>
#include <stdlib.h>
#include <time.h>

#define MAX 10000000000LLU

int main(int argc, char *argv[])
{
    unsigned long long i,x,y;
    time_t ini;

    ini = time(NULL);

    for(i = 0 ; i < MAX ; i++)
        if(i % 2);

    printf("%lu segundos\n", time(NULL) - ini);

    ini = time(NULL);

    for(i = 0 ; i < MAX ; i++)
        if(i & 1);

    printf("%lu segundos\n", time(NULL) - ini);

    return 0;
}


Se nota la diferencia, pero para que sea considerable, he tenido que llegar a 10^10 iteraciones...

Aun así, se ve que es preferible comprobar el bit menos significativo en un código que requiera continuamente la comprobación de la paridad de un numero a utilizar el operador módulo.

¡Saludos!
- Doctor, confundo los números y los colores.
- Vaya marrón.
- ¿Marrón? ¡Por el culo te la hinco!

eferion

Cita de: do-while en 22 Julio 2013, 09:28 AM
Se nota la diferencia, pero para que sea considerable, he tenido que llegar a 10^10 iteraciones...

Está claro que, pese a ser más pesada, una operación de división está lo suficientemente optimizada ( al menos cuando se manejan números enteros ) como para no ser un lastre excesivo... salvo que estés en un entorno de tiempo real crítico.

Lo que sí está claro es que, sobretodo en el caso de bucles con un gran número de repeticiones, las pequeñas optimizaciones se van notando cada vez más... obviamente hacer una sustitución así en, por ejemplo, una función que se ejecuta una vez cada vez que un usuario hace click sobre un botón no es una mejora a la que el vayas a sacar partido realmente.

La siguiente mejora que podrías plantearte en este código es el que sea capaz de manejar números realmente grandes... de 100, 200 ... 1000 cifras.

Funciones matemáticas optimizadas y con opción a manejar números grandes... más sus optimizaciones para números enteros normales, sería una buena base para sacar una librería matemática interesante.

amchacon

Cita de: do-while en 22 Julio 2013, 09:28 AMSe nota la diferencia, pero para que sea considerable, he tenido que llegar a 10^10 iteraciones...
Tú código no es correcto para cualquier compilador actual, mi compilador directamente se salta los fors y los ifs porque los considera que son inútiles. La prueba está en que los fors no aparecen en el código ensamblador:

Código (asm) [Seleccionar]
.file "main.cpp"
.def __main; .scl 2; .type 32; .endef
.section .rdata,"dr"
.LC0:
.ascii "%lu segundos\12\0"
.section .text.startup,"x"
.p2align 4,,15
.globl main
.def main; .scl 2; .type 32; .endef
.seh_proc main
main:
.LFB49:
pushq %rsi
.seh_pushreg %rsi
pushq %rbx
.seh_pushreg %rbx
subq $40, %rsp
.seh_stackalloc 40
.seh_endprologue
call __main
movq __imp__time64(%rip), %rbx
xorl %ecx, %ecx
call *%rbx
xorl %ecx, %ecx
movq %rax, %rsi
call *%rbx
leaq .LC0(%rip), %rcx
movq %rax, %rdx
subq %rsi, %rdx
call printf
xorl %ecx, %ecx
call *%rbx
xorl %ecx, %ecx
movq %rax, %rsi
call *%rbx
leaq .LC0(%rip), %rcx
movq %rax, %rdx
subq %rsi, %rdx
call printf
xorl %eax, %eax
addq $40, %rsp
popq %rbx
popq %rsi
ret
.seh_endproc
.ident "GCC: (rev1, Built by MinGW-builds project) 4.8.1"
.def printf; .scl 2; .type 32; .endef


Lo modifique tal que así:

Código (cpp) [Seleccionar]
#include <stdio.h>
#include <stdlib.h>
#include <time.h>

#define MAX 5000000000LLU

int main(int argc, char *argv[])
{
   unsigned long long i;
   unsigned int Contador = 0;
   time_t ini;

   ini = time(NULL);

   for(i = 0 ; i < MAX ; i++)
      Contador += i% 2;

   printf("%lu segundos\n", time(NULL) - ini);

   ini = time(NULL);

   for(i = 0 ; i < MAX ; i++)
       Contador -= i&1;

   printf("%lu segundos\n", time(NULL) - ini);

    printf("%d",Contador);

   return 0;
}


Ahora si que se nota que hace las operaciones, aunque haciendo pruebas. Me di cuenta que ambas operaciones dependían más del factor suerte que de otra cosa (a veces ganaba uno, otra veces ganaba otro y otras veces empataban). Analizando el código ASM:

Código (asm) [Seleccionar]
.file "main.cpp"
.def __main; .scl 2; .type 32; .endef
.section .rdata,"dr"
.LC0:
.ascii "%lu segundos\12\0"
.LC1:
.ascii "%d\0"
.section .text.startup,"x"
.p2align 4,,15
.globl main
.def main; .scl 2; .type 32; .endef
.seh_proc main
main:
.LFB49:
pushq %rdi
.seh_pushreg %rdi
pushq %rsi
.seh_pushreg %rsi
pushq %rbx
.seh_pushreg %rbx
subq $32, %rsp
.seh_stackalloc 32
.seh_endprologue
xorl %ebx, %ebx
call __main
movq __imp__time64(%rip), %rsi
xorl %ecx, %ecx
call *%rsi
xorl %edx, %edx
movabsq $5000000000, %r8
movq %rax, %rdi
.p2align 4,,10
.L3:
movl %edx, %ecx
addq $1, %rdx
andl $1, %ecx
addl %ecx, %ebx
cmpq %r8, %rdx
jne .L3
xorl %ecx, %ecx
call *%rsi
leaq .LC0(%rip), %rcx
movq %rax, %rdx
subq %rdi, %rdx
call printf
xorl %ecx, %ecx
call *%rsi
xorl %edx, %edx
movabsq $5000000000, %r8
movq %rax, %rdi
.p2align 4,,10
.L5:
movl %edx, %ecx
addq $1, %rdx
andl $1, %ecx
subl %ecx, %ebx
cmpq %r8, %rdx
jne .L5
xorl %ecx, %ecx
call *%rsi
leaq .LC0(%rip), %rcx
movq %rax, %rdx
subq %rdi, %rdx
call printf
leaq .LC1(%rip), %rcx
movl %ebx, %edx
call printf
xorl %eax, %eax
addq $32, %rsp
popq %rbx
popq %rsi
popq %rdi
ret
.seh_endproc
.ident "GCC: (rev1, Built by MinGW-builds project) 4.8.1"
.def printf; .scl 2; .type 32; .endef


Podemos identificar los dos fors aquí:

Código (asm) [Seleccionar]
.L3:
movl %edx, %ecx
addq $1, %rdx
andl $1, %ecx
addl %ecx, %ebx
cmpq %r8, %rdx
jne .L3

Código (asm) [Seleccionar]
.L5:
movl %edx, %ecx
addq $1, %rdx
andl $1, %ecx
subl %ecx, %ebx
cmpq %r8, %rdx
jne .L5


Fijate que el compilador lo ha optimizado haciendo las mismas operaciones en los dos casos. Es curioso que incluso desactivando la optimización del compilador, tenemos las mismas operaciones en el for:

Código (asm) [Seleccionar]
.file "main.cpp"
.def __main; .scl 2; .type 32; .endef
.section .rdata,"dr"
.LC0:
.ascii "%lu segundos\12\0"
.LC1:
.ascii "%d\0"
.text
.globl main
.def main; .scl 2; .type 32; .endef
.seh_proc main
main:
.LFB36:
pushq %rbp
.seh_pushreg %rbp
movq %rsp, %rbp
.seh_setframe %rbp, 0
subq $64, %rsp
.seh_stackalloc 64
.seh_endprologue
movl %ecx, 16(%rbp)
movq %rdx, 24(%rbp)
call __main
movl $0, -12(%rbp)
movl $0, %ecx
call time
movq %rax, -24(%rbp)
movq $0, -8(%rbp)
jmp .L2
.L3:
movq -8(%rbp), %rax
andl $1, %eax
addl %eax, -12(%rbp)
addq $1, -8(%rbp)
.L2:
movabsq $4999999999, %rax
cmpq %rax, -8(%rbp)
jbe .L3
movl $0, %ecx
call time
subq -24(%rbp), %rax
movq %rax, %rdx
leaq .LC0(%rip), %rcx
call printf
movl $0, %ecx
call time
movq %rax, -24(%rbp)
movq $0, -8(%rbp)
jmp .L4
.L5:
movq -8(%rbp), %rax
andl $1, %eax
subl %eax, -12(%rbp)
addq $1, -8(%rbp)
.L4:
movabsq $4999999999, %rax
cmpq %rax, -8(%rbp)
jbe .L5
movl $0, %ecx
call time
subq -24(%rbp), %rax
movq %rax, %rdx
leaq .LC0(%rip), %rcx
call printf
movl -12(%rbp), %eax
movl %eax, %edx
leaq .LC1(%rip), %rcx
call printf
movl $0, %eax
addq $64, %rsp
popq %rbp
ret
.seh_endproc
.ident "GCC: (rev1, Built by MinGW-builds project) 4.8.1"
.def time; .scl 2; .type 32; .endef
.def printf; .scl 2; .type 32; .endef


Código (asm) [Seleccionar]
jmp .L2
.L3:
movq -8(%rbp), %rax
andl $1, %eax
addl %eax, -12(%rbp)
addq $1, -8(%rbp)
.L2:
movabsq $4999999999, %rax
cmpq %rax, -8(%rbp)
jbe .L3

Código (asm) [Seleccionar]
jmp .L4
.L5:
movq -8(%rbp), %rax
andl $1, %eax
subl %eax, -12(%rbp)
addq $1, -8(%rbp)
.L4:
movabsq $4999999999, %rax
cmpq %rax, -8(%rbp)
jbe .L5


Ergo, no. No hay diferencia entre % y & en un compilador actual.
Por favor, no me manden MP con dudas. Usen el foro, gracias.

¡Visita mi programa estrella!

Rar File Missing: Esteganografía en un Rar

eferion

La pregunta entonces es... ¿ Es aplicable ese resultado a cualquier compilador ?

Creo que habría entonces que hacer una batería de pruebas con diferentes compiladores, porque no creo que todos implementen las mismas optimizaciones...

Eso si... te lo has currado mirándote el código en ensamblador

do-while

#15
amchacon, eres un tramposo...  :xD

Deja que los niños jueguen en igualdad de condiciones, que sino se sienten discriminados...  ;D

#include <stdio.h>
#include <stdlib.h>
#include <time.h>

#define MIN 37
#define MAX 42

typedef unsigned long long fibo_t;

unsigned long long llamadas_clasico;
unsigned long long llamadas_optimizado;

#define MAX_CACHE 33

unsigned long long Fibonaci_Cache[MAX_CACHE] = {1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987,1597
,2584,4181,6765,10946,17711,28657,46368,75025,121393,196418,317811,514229,832040,1346269,2178309,31524578};

fibo_t fibo_clasico(fibo_t n)
{
   llamadas_clasico++;

   if(n < MAX_CACHE)
       return Fibonaci_Cache[n];

   return fibo_clasico(n - 1) + fibo_clasico(n - 2);
}

fibo_t fibo(fibo_t n)
{
   llamadas_optimizado++;

   if(n < MAX_CACHE)
       return Fibonaci_Cache[n];

   if(n % 2) //n impar y mayor que 2
   {
       fibo_t k1,k2;

       k1 = fibo((n + 1) / 2);
       k2 = fibo((n - 1) / 2);

       return k1 * k1 + k2 * k2;
   }

   //n par y mayor que 2
   return fibo(n / 2) * (fibo((n / 2) + 1) + fibo((n / 2) - 1));
   //si n == 2 fibo(n / 2) * fibo(n / 2 + 1) = fibo(1) * fibo(2)
   //habria recursion infinita si no se pone n == 2 como caso base
}

int main(int argc, char *argv[])
{
   fibo_t i,valor;
   time_t ini;

   printf("Fibonacci clasico:\n");

   ini = time(NULL);

   for(i = MIN ; i < MAX ; i++)
   {
       llamadas_clasico = 0;
       valor = fibo_clasico(i);

       printf("  fibo_clasico(%llu) = %llu (%llu llamadas)\n",i,valor,llamadas_clasico);
   }

   printf("%llu segundos\n",time(NULL) - ini);

   printf("\nFibonacci optimizado:\n");

   ini = time(NULL);

   for(i = MIN ; i < MAX ; i++)
   {
       llamadas_optimizado = 0;
       valor = fibo(i);

       printf("  fibo(%llu) = %llu (%llu llamadas)\n",i,valor,llamadas_optimizado);
   }

   printf("%llu segundos\n",time(NULL) - ini);

   return 0;
}


¡Saludos!

Por cierto, ¿cómo has conseguido el código en ensamblador? Supongo que será alguna opción del compilador, pero nunca me he metido mucho a jugar con el, así que no se que opción has utilizado...

¡Saludos!
- Doctor, confundo los números y los colores.
- Vaya marrón.
- ¿Marrón? ¡Por el culo te la hinco!

amchacon

#16
Cita de: eferion en 22 Julio 2013, 11:00 AM
La pregunta entonces es... ¿ Es aplicable ese resultado a cualquier compilador ?

Creo que habría entonces que hacer una batería de pruebas con diferentes compiladores, porque no creo que todos implementen las mismas optimizaciones...
Seguramente las implementaciones varien de un compilador a otro, pero lo normal esque hagan estas optimizaciones automáticamente, si no esque estás usando un compilador-patata.

Cita de: do-while en 26 Julio 2013, 10:30 AM
amchacon, eres un tramposo...  :xD

Deja que los niños jueguen en igualdad de condiciones, que sino se sienten discriminados...  ;D
En las sucesiones lineales se pueden hacer muchas trampas  :xD

Seguramente en los juegos lo implementarán así, para ganar rendimiento.

Cita de: do-while en 26 Julio 2013, 10:30 AMPor cierto, ¿cómo has conseguido el código en ensamblador? Supongo que será alguna opción del compilador, pero nunca me he metido mucho a jugar con el, así que no se que opción has utilizado...
Hay que pasarle el flag -S al compilador.

Si usas un IDE como Codeblocks, se puede hacer la siguiente chapuzilla:

- Crea un proyecto de consola, pon el código y vete a Project -> build options -> other options. Escribir -S

Dale a reconstruir todo (control+F11). Al final dará un error (porque intentará linkar y verá que no puede  ;D). Vete a la carpeta obj de tu proyecto y abre el archivo con el notepad.
Por favor, no me manden MP con dudas. Usen el foro, gracias.

¡Visita mi programa estrella!

Rar File Missing: Esteganografía en un Rar

do-while

¡Buenas!

Me acabo de dar cuenta de que el último valor del vector está mal. Se te ha colado un 1 entre el 3 y el 5. Te aviso por si vas a utilizar el código para otros programas, no vaya a ser que no te salgan los cálculos y te vuelvas loco buscando el origen de todo mal (a mi me ha pasado  ;D) Aquí te dejo el vector correcto.


unsigned long long Fibonaci_Cache[MAX_CACHE] = {0,1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987,1597
,2584,4181,6765,10946,17711,28657,46368,75025,121393,196418,317811,514229,832040,1346269,2178309,3524578};


¡Saludos!
- Doctor, confundo los números y los colores.
- Vaya marrón.
- ¿Marrón? ¡Por el culo te la hinco!

eferion

Cita de: amchacon en 26 Julio 2013, 10:49 AM
Seguramente las implementaciones varien de un compilador a otro, pero lo normal esque hagan estas optimizaciones automáticamente, si no esque estás usando un compilador-patata.

Yo solo me refería la hecho de que las optimizaciones comentadas fuesen equivalentes al menos en los compiladores más utilizados... ya que si alguno de éstos no es capaz de optimizar alguna de las posibilidades propuestas tal vez habría que optar por la opción B.

En cuanto a las optimizaciones automáticas... variarán en función de cómo configures la compilación... compilar con debug = 0 optimizaciones y de ahí hasta lo que te ofrezca el propio compilador... luego también puedes añadir flags para que las optimizaciones vayan en pro de la velocidad o en pro del consumo de memoria...

En fin, que yo creo que es malo generalizar en este tema.