¿Y si creamos un lenguaje de programación? [ACTUALIZADO]

Iniciado por leogtz, 4 Julio 2012, 10:34 AM

0 Miembros y 2 Visitantes están viendo este tema.

leogtz

Hola a todos, en estas vacaciones me he dedicado a escribir un intérprete para un lenguaje de programación, el cuál llamé "Yare".

Está escrito en C, con ayuda de lex y yacc.

El lenguaje que estoy haciendo aún es muy limitado, pero ya tiene algunas cosas algo "rescatables", como por ejemplo:

- Ciclos: for, while, do-while, unless.
- Condicional if y algunas expresiones se pueden procesar así:

expresion == expression && sentencia;

Un ejemplo:
Código (cpp) [Seleccionar]
1 == 1 && "Ok\n";
-Sentencia tipo "read(var)"
-Inicialización con valor aleatorio, ejemplo:
Código (cpp) [Seleccionar]
x = ?;

- Lo he hecho bastante "rico" en comentarios, es decir, se admiten comentarios de la forma
Código (cpp) [Seleccionar]
/* hjkhjkasd
asdasd
*/

Código (cpp) [Seleccionar]
rem Comentario de una sóla línea
Código (cpp) [Seleccionar]
# Comentario de una sóla línea
Código (cpp) [Seleccionar]
-- Comentario de una sóla línea
Código (cpp) [Seleccionar]
// Comentario de una sóla línea
Código (cpp) [Seleccionar]
:: Comentario de una sóla línea

- Caracteres especiales en la sentencia "puts(string)", los mismos que en C:
\n, \t, \s(este es de Perl), \b, \r, \f.
Añadí uno propio así:
\q el cuál inserta una doble comilla '"'.

- Además añadí unos caracteres de escape de nueva línea numéricos, es decir.

Código (cpp) [Seleccionar]
puts("Hola\1mundo") <- Haría que se insertara un \n
puts("Hola\2mundo") <- Haría que se insertara dos \n
puts("Hola\3mundo") <- Haría que se insertara tres \n
y así hasta el 9.

No hay tipos de datos por ahora, el tipo de dato que manejo es "double".

Hay 26 variables por default, las variables son de la "a" a la "z" y no es sensible a mayúsculas y minúsculas. Estas variables siempre están ahí disponibles.

-Se pueden definir variables propias de este modo:
Código (cpp) [Seleccionar]
:suma: = 2^3; ó así:
Código (cpp) [Seleccionar]
declare(:suma:, 2^3);
Código (cpp) [Seleccionar]
declare(:suma:);

Los identificadores pueden ser bastante flexibles, ejemplo:
Código (cpp) [Seleccionar]
: _Hola mundo # 123342432 : = 123;
printn(: _Hola mundo # 123342432 :);


Se pueden definir bloques de código:
Código (cpp) [Seleccionar]
{
  sentencias...
}


-Constantes numéricas:
número pi, número e, logaritmo en base 2 de el número e, y varias más, se pueden utilizar así:
Código (cpp) [Seleccionar]
printn(cos(const.pi^2));

-Operadores:
+, -, *, /, ^, %, <<, >>, |, &, &&, ||, ! y ~ para negación, XOR.

-Funciones matemáticas:
Código (cpp) [Seleccionar]
factorial(expr), abs(expr), ln(expr), cos(expr), sin(expr), tan(expr), atan(expr), asin(expr), acos(expr), floor(expr), sinh(expr), sumatoria(expr, expr), etc.

-Operadores de posdecremento y posincremento, de esta manera:
Código (cpp) [Seleccionar]
a = 1;
a+@;
a-@;

ó incr(variable), decr(variable)


-Operador variable, lo que llamé operador variable no es más que un operador global que puede ser modificado, algo así:
Código (cpp) [Seleccionar]
_@_= *;
_@_ = /;
_@_ = -;
etc...


Y que luego pueda ser usado de esta manera:

Código (cpp) [Seleccionar]
_@_ = *;
printn(1 + 2 _@_ 3);

¿Para qué podría servir esto? no lo sé :)

-Inicialización por medio de smileys....  ;D, algo así:
Código (cpp) [Seleccionar]
x = :);   # Lo inicializa a 1
x = :|;  # Lo inicializa a 0
x = :(;  # Lo inicializa a -1.


-Sentencia break para los ciclos, aún no hallo como implementar la sentencia continue.

-Ciclo foreach de esta manera:
Código (cpp) [Seleccionar]
foreach(1 ... factorial(5), k) {
printn(k);
}


-Sentencia system(CADENA).

-Asignaciones flexibles:
Código (cpp) [Seleccionar]
let x to 1+2;
set x to 1+2;
move 1+2 to x;
x = 1+2;
mov x, 1+2;
x <- 1+2;
let x = 1+2;
set x = 1+2;
x := 1+2;

Todas ellas son equivalentes.

-Sentencias tipo assembly:
Código (cpp) [Seleccionar]
mov x, factorial(6);
sub x, -123;
add x, 1+2;


-Sentencia "swap" para intercambiar valores:

Código (cpp) [Seleccionar]
x = 1;
y = 2;
x <-> y;


-Sentencia exit:
Código (cpp) [Seleccionar]
exit(-1);

-Sentencia read(variable) para leer desde el teclado, ejemplo:
Código (cpp) [Seleccionar]
read(x);
for i = 0, i < x, +1 {
printn(i);
}


-Asignaciones abreviadas:
Código (cpp) [Seleccionar]
x += 1;
x -= 1;
x *= 1;
x ^= 3;
x /= 2;
x <<= 1;
x >>= 1;
x |= 1;
x &= 1;
x %= 2;


-Función par(expr) para saber si el número resultado de la expresión es par.

-Definición de procedimientos por el usuario, en la forma:
Código (cpp) [Seleccionar]
proc $suma$ {
a += b;
# Demás sentencias ...
}

a = 1;
b = 2;

# Imprime 3
# El valor retornado por el procedimiento o función es
# el resultado de la última sentencia o expresión.
printn(call $suma$);


-Soporta recursión, obviamente no tan flexible, un ejemplo de cálculo del factorial con algoritmo recursivo:
Código (cpp) [Seleccionar]
# Intento de recursion
proc $factorial$ {
if(a != 1) {
r *= a;
a-@;
call $factorial$;
}
}

# Calculando el factorial de 5:
a = 5;
r = 1;

call $factorial$;
printn(r);

.


Da por resultado 120.

La ejecución de algunos programas no es tan lenta, por ejemplo, calculemos el número pi en perl y luego calculemoslo en Yare.
Código (perl) [Seleccionar]
#!/usr/bin/env perl
my $suma = 0.0;
my $i = 0.0;
for($i = 1; $i <= 1000000; $i++) {
$suma += (-1)**($i + 1)/(2 * $i - 1);
}
$suma *= 4.0;
print($suma . "\n");

3.14159165358978

real 0m0.646s
user 0m0.572s
sys 0m0.004s


Ahora en Yare:
:suma: = 0;
for i = 1, i <= 1000000, +1 {
:suma: += (-1)^(i + 1)/(2 * i - 1);
}
:suma: *= 4.0;
puts("pi = ");
printn(:suma:);
.

pi = 3.141592

real 0m0.641s
user 0m0.564s
sys 0m0.000s


Los tiempos de ejecución son muy similares. Obviamente no pretendo decir que la calidad de mi código es superior o si quiera igual que el de Perl, sería una estupidez, pero bueno... .
Estas son algunas cosas que he implementado en Yare, es muy muy limitado, pero bueno, quizás alguien quiera hacerlo crecer junto conmigo.

Lo primero en qué hay que pensar cuando se quiere hacer un lenguaje es "¿para qué va a servir?", "¿qué objetivo tiene?", yo no tengo objetivo, sólo aprender, ver cómo funcionan las cosas, y he aprendido muchisimo, no todo ha sido "miel sobre ojuelas", he batallado mucho con esto, han sido horas y horas de programar y a veces de dedicarle un día entero a algo y ver al final que las cosas no funcionan, y ni modo, a seguir adelante con otra cosa.

Por ahora estoy añadiendo soporte para arrays, pero les soy sincero, ya me aburrí de esto, porque son muchas horas dedicadas a esto y tengo otras cosas que hacer :).


Entonces ahí está la petición, si alguien quiere unirse a desarrollar esto, yo encantado.

Saludos.
Código (perl) [Seleccionar]

(( 1 / 0 )) &> /dev/null || {
echo -e "stderrrrrrrrrrrrrrrrrrr";
}

http://leonardogtzr.wordpress.com/
leogutierrezramirez@gmail.com

AgnesBlack

#1
excelente trabajo

jhonatanAsm

CitarInicialización por medio de smileys....  , algo así:


x = :);   # Lo inicializa a 1
x = :|;  # Lo inicializa a 0
x = :(;  # Lo inicializa a -1.


que imaginativo...

salu2.
mi primer lenguaje fue ensamblador, tengo 60 años, y no creo que haya sido un error.

- La mayor complejidad de todas es hacer complejo algo que no lo es.

- El inteligente no es aquel que lo sabe todo sino aquel que sabe utilizar lo poco que sabe.

leogtz

Cita de: jhonatanAsm en 12 Julio 2012, 07:17 AM
que imaginativo...

salu2.

Gracias :), cualquier otro podría ponerle inicializaciones como quisiera, es bastante sencillo en realidad.
Código (perl) [Seleccionar]

(( 1 / 0 )) &> /dev/null || {
echo -e "stderrrrrrrrrrrrrrrrrrr";
}

http://leonardogtzr.wordpress.com/
leogutierrezramirez@gmail.com

dac

Te esta quedando genial! felicitaciones! , estas implementando el compilado para traducir el código directamente a ASM? o lo parcea luego algún otro compilador en un nivel inferior?

leogtz

El lenguaje es interpretado, el intérprete está hecho en C, básicamente el intérprete es una función recursiva, lo cual hace fácilmente implementable cualquier función que se desee, pensar crear código objeto es ir bastante lejos, mis conocimientos no son tan grandes.

Saludos.
Código (perl) [Seleccionar]

(( 1 / 0 )) &> /dev/null || {
echo -e "stderrrrrrrrrrrrrrrrrrr";
}

http://leonardogtzr.wordpress.com/
leogutierrezramirez@gmail.com

Yoghurt

Me ha gustado lo de la iniciación por "caritas" +1

Noté que usas ";" para fin de linea osea lo usas para saber cuando a acabado la declaracion de la expresión, eso siempre ha sido mi punto debil he de admitir por lo que sería genial que añadieras otra forma de finalizar la expresion tal como un "[Intro]" o un "." se parece demasiado al C.

Note que incluiste comentarios de diferentes lenguages y se me paso por la cabeza que éste interprete tuyo podria ser "El lenguaje universal" claro con su nombre Yare ;) es un gran desafío.

la forma de declarar las variables :variable: es vastante novedosa +2 :esto es una variable: :D genial!, aunq como concatenarias tu dos variables?

:var1: = 'hola ';
:var2: = 'mundo!';
printn(:var1: + :var2:);
printn(:var1: . :var2:);
printn(:var1::var2:);
var2 = 'Esto es una variable?';


mm... siempre me ha gustado la iniciacion de variable tipo "x=b=numero=foo=43" donde x, b, numero, foo tienen el mismo valor 43.

Pregunta; los nombres de las funciones tienen que llevar el "$"?

leogtz

Cita de: AbrahamAraon en 17 Julio 2012, 12:11 PM
Me ha gustado lo de la iniciación por "caritas" +1

;D

Cita de: AbrahamAraon en 17 Julio 2012, 12:11 PM
Noté que usas ";" para fin de linea osea lo usas para saber cuando a acabado la declaracion de la expresión, eso siempre ha sido mi punto debil he de admitir por lo que sería genial que añadieras otra forma de finalizar la expresion tal como un "[Intro]" o un "." se parece demasiado al C.

Se puede, claro, hay que checarlo con detenimiento, por ejemplo, si quisieramos terminar la expresión o sentencia con un '.' podría haber algo así:

1+2.

Pero el intérprete se confundiría ya que puede ser un número decimal o no, cuestiones como esas son las que te topas al programar algo así, aunque pudiera utilizarse otro caracter para fin de sentencia, sólo habría que verificar que no se usara en ninguna otra parte o entrara en conflicto con otras cosas.

Cita de: AbrahamAraon en 17 Julio 2012, 12:11 PM
la forma de declarar las variables :variable: es vastante novedosa +2 :esto es una variable: :D genial!, aunq como concatenarias tu dos variables?

:var1: = 'hola ';
:var2: = 'mundo!';
printn(:var1: + :var2:);
printn(:var1: . :var2:);
printn(:var1::var2:);
var2 = 'Esto es una variable?';


Eso lo intenté, el realizar algo así:
print("hola! ", : variable :, " bye", "ok\n\4", 1 + 2.34545, -5, "etc....");

Pero no es tan sencillo, en el analizador sintáctico habría que realizar una buena BNF que soporte todo eso, algo así:

print_expression_list:
    print_expression_list ',' expression
    | {;} /* por si se escribe print() */

expression:
    constante_numerica
    | cadena
    | variable
    | ID


Habría que checar con detenimiento la forma Backus-Naur,


Sobre lo de los nombres de las funciones delimitadas con $$ se puede cambiar, no es mucho problema, el código actual para eso es bastante sencillo, algo así:

[$].+[$] {
strcpy(yylval.nameFunction, yytext);
yylval.nameFunction[strlen(yylval.nameFunction)] = '\0';
return FUNCNAME;
}


[$].+[$] es la expresión regular que utilizo para coincidir $texto$.

Saludos.
Código (perl) [Seleccionar]

(( 1 / 0 )) &> /dev/null || {
echo -e "stderrrrrrrrrrrrrrrrrrr";
}

http://leonardogtzr.wordpress.com/
leogutierrezramirez@gmail.com

lnvisible

¿has visto lo que hace coffeescript con javascript o lo que hace clojurescript?

Es mucho más fácil que hacer un lenguaje de programación porque sólo tienes que traducir entre lenguajes, así que no te tienes que preocupar del código intermedio, la tabla de símbolos y todas esas cosas que hay que manejar en un compilador para acabar generando ensamblador. Es más fácil generar javascript que ensanblador.

Lo que puedes hacer es algo parecido a coffeescript, que es un lenguaje muy sencillo y legible, o python, o alguno así que te guste, y generar lisp.

Si generas lisp luego eso se puede traducir a clojure y a clojurescript, es cedir que lo puedes pasar a java y a javascript, servidor y cliente, y montones de librerías para usar, como con scala.

Y sólo por hacer una traducción de algo más legible que lisp.

Un primer paso sería cambiar los paréntesis por niveles de indentación, como en coffeescript y python. Con eso sería mucho más legible en mi opinión.

Piénsalo :D

leogtz

Cita de: lnvisible en 17 Julio 2012, 23:30 PM
¿has visto lo que hace coffeescript con javascript o lo que hace clojurescript?

Es mucho más fácil que hacer un lenguaje de programación porque sólo tienes que traducir entre lenguajes, así que no te tienes que preocupar del código intermedio, la tabla de símbolos y todas esas cosas que hay que manejar en un compilador para acabar generando ensamblador. Es más fácil generar javascript que ensanblador.

Lo que puedes hacer es algo parecido a coffeescript, que es un lenguaje muy sencillo y legible, o python, o alguno así que te guste, y generar lisp.

Si generas lisp luego eso se puede traducir a clojure y a clojurescript, es cedir que lo puedes pasar a java y a javascript, servidor y cliente, y montones de librerías para usar, como con scala.

Y sólo por hacer una traducción de algo más legible que lisp.

Un primer paso sería cambiar los paréntesis por niveles de indentación, como en coffeescript y python. Con eso sería mucho más legible en mi opinión.

Piénsalo :D

Sí, de hecho imprimí el libro "how to create your own freaking awesome language" el cuál inspiró a los creadores de coffescript, el problema es que está hecho en ruby, y no me llevo muy bien con él. De hecho los creadores de coffescript utilizan también herramientas como bison y flex, lo bueno del libro es que dan el código para empezar, pero para lograr hacer algo propio hay que estudiar en demasía el código, algo que quizás en su momento me desalentó puesto que yo quería obtener resultados de manera más pronta.

La idea que tengo, que quizás trabaje en unos meses es ponerle tipos de datos e implementar una librería tipo BigInt(o utilizar gmp), para ponerle un propósito al lenguaje ...

Saludos.
Código (perl) [Seleccionar]

(( 1 / 0 )) &> /dev/null || {
echo -e "stderrrrrrrrrrrrrrrrrrr";
}

http://leonardogtzr.wordpress.com/
leogutierrezramirez@gmail.com