Importante duda sobre Consulta SQL AVANZADA

Iniciado por Skeletron, 4 Agosto 2009, 09:03 AM

0 Miembros y 2 Visitantes están viendo este tema.

Skeletron

Noo..
A esta web, es probable que la haga en mi PC.. en un server mio... U.U

SnakeDrak

#21
Hola,

Ps.. no le veo sentido a lo que quieres hacer, yo tengo un hash que no se puede descifrar (no por ahora) y no tiene más de 10 lineas (claro que tiene muchas funciones) y tampoco devuelve una cadena muy grande, pero es suficiente, bueno aún así puedes hacer lo que dices sin necesidad de almacenar todo en una variable PHP, pongamos que cada parte del HASH tiene 5 números, almacenaremos todos en un LONGTEXT y lo separaremos con ; (solo para que sea entendible), entonces tenemos:

campo hash (LONGTEXT): 32456;54567;23450;12346;

Ese sería un ejemplo donde cada parte tiene 5 números y hay un total de 4, si queremos seleccionar solo el hash 3 pues sería: 3*(5+1)

Código (sql) [Seleccionar]

SELECT SUBSTRING( `hash` , (3-1)*(5+1)+1, 5 ) FROM `tabla`


Lo pongo con +1 para que sepas donde tienes que cambiar el 5 y el 3, eso seleccionaría todos los terceros hash.

Si aún no lo entiendes dime e intentaré explicarlo mejor.

Aquí tienes funciones de SQL: http://mysql.conclase.net/curso/index.php?fun=SUBSTRING
Saludos!

Skeletron

#22
Pero, para que me hablas de HASH?!?!!? y de Encriptacion???
Yo no tengo que cifrar ningun dato..
Estoy tomando muestras de un archivo y luego comprarlas con otras muestras... no puede haber hashes.. y si los hubiese, sería totalmente en bano...




AGREGO:
Todos me han dicho que es incoherente... Bien... pero IBM le dijo a Bill Gates que las computadoras personales tambien serían totalmente en bano, e incoherentes y nadie las compraria.. y lo mismo pasó con Twitter.. quien iba a querer decir a cada rato que esta haciendo?? o quien iba a querer madnar texto por celular si podia llamar...

En fin amigo.. Cuando algo es INNOVADOR, no quiere decir que sea INCOHERENTE o malo..
Porque supongo que estamos todos TOTALMENTE seguros que yo no di a entender aun el verdadero funcionamiento de la futura web... :) Si realmente quisiera ver si un archivo es igual a otro, simplemente le hago un HASH a todo su contenido y lo comparo con el HASH del que entra...

Porque nadie puede cerrar su ecrebro auna idea que consiste en TOAMR MUESTRAS Y COMPARARLAS... la pregunta era: ¿Puede MySQL hacer la comparacion si coinciden porcentajes? NO fue la respuesta... OK.. entonces tengo que tomar cada linea y analizarla.. FIN del tema..

SnakeDrak

Hola,

AJÁ y yo dije que lo que quieres hacer no tiene sentido pero te di una solución, así que pruebala y deja de decir que MYSQL no puede hacerlo, porque sí puede hacerlo y de hecho te lo puse, puedes comparar las cadenas que quieras almacenandolas todas en un LONGTEXT sin necesidad de recurrir a PHP.

Las historias guardatelas para otra cosa y en vez de leer solo mi primera linea lee todo el mensaje ;) sea hash o sea una cadena, lo que te puse vale igual.

Según he podido leer querías algo así para no tener que comparar todo desde PHP (porque tendrías que almacenar los 500 y los que sea que necesitas..)

Saludos y ojalá te sea de ayuda, lee la función substring y la página que te dejé, estoy seguro de que con esas funciones podrás hacerlo al menos si no estoy equivocado en lo que quieres hacer.

Skeletron

SUBSTRING amigo, devuelve un "pedazo" de una cadena.. ¿ok?
Bueno... ahora... yo tengo que hacerte una pregunta:
Has leido con detalle todos los post de arriba?? hasta el comienzo??? has leido las 2 paginas?
Yo no tengo que "reuperar" strings... tengo que comparar strings con otras strings, y si el 75% coinciden.. o sea, si el 75% son iguales, me tiene de "seleccionar" la entrada esa para devovlerla... pero.. el 75% de los "substrings" de 1 entrada...
Leete bien todo...

SnakeDrak

Hola,

Perdona pero creo que no es forma correcta la tuya de responer, ya no pienso ayudar más para que me respondan así, si no sabes hacerlo aprende un poco más de SQL a y te recomiendo que te expreses un poco mejor porque ni tú tienes clara la idea de lo que quieres hacer y si la tienes clara no te expresas/escribes correctamente y algunas cosas no se comprenden.

Eso que dices se puede hacer sin problemas, comparar strings con otras strings y ver el % de comparación, tal vez no en 1 sola consulta, pero en 2 consultas podrías hacerlo.

Por supuesto si te intentan ayudar y respondes así pues.. no creo que te ayuden.

Saludos y suerte.

Skeletron

#26
Amigo, amigo.. no es apra que te enojes...
Me he redactado todo de nuevo y aqui te lo digo:

Introduccion:
Imaginate que tengo la carpeta: C:/ARCHIVOS y en ella hay 50.000 archivos .txt con MUCHO texto tentro
Desde mi web, (PHP) ingresando otro .txt en un formulario, analizaré si hay un archivo "parecido" al ingresado en mi carpeta C:/ARCHIVOS..
El archivo ingresado, se considera "parecido" si: Es totalmente igual, o hasta en un 70% (ésto es lo que produce el problema)

Dato:
El algoritmo de INDEXADO a la base de datos de los archivo de la carpeta, consiste en tomar 10 muestras de 5 "caracteres" de los archivos de C:/ARCHIVOS y guardarlos consecutivamente como 1 sola gran palabra...
O sea: Con un motor, voy a entrar a cada uno de los archivos y voy a tomar ese muestreo y guardarlo en la base de datos a esa gran palabra que me quedó..
La palabra será de 50 caracteres, proque son 10 muestras de 5 Caracteres..


Web:
Desde la web se ingresa X archivo y se le toma el mismo muestreo...


Opciones:
En la base de datos puedo guardar las muestras de varias formas.. por ejemplo con separadores o sin..
Con separadores: 12345;34567;98654;98764 (y así hasta llegar a las 10 muestras)
O sin separadores: 1234567898765432 (y así hasta llegar a las 10 muestras)


Lo que tengo que hacer:
Con la muestra que tengo del archivo ingresado, tengo que COMPRAR los tramos...
O sea.. agarro los primeros 5 caracteres de la muestra del arcchivo ingresado, y los comparo con los 5 primeros caracteres de la 1º entrada de la base de datos.. en caso de ser TOTALMENTE IGUALES, "suma 1 punto", despues compara los otros 5.. y así... al finalizar el escanero de la primer entrada de la base de datos, me va a decir: "Tenemos 8 tramos iguales", por lo tanto, este archivo supera el 70% establecido de "comparacion", y se considera que el archivo ingresado y la 1º entrada de la base de datos son IGUALES o PARECIDOS.. y por lo tanto, tengo que "devolver" esa entrada con MYSQL..
Despues sigue comparando toda la base de datos y me tiene que devolver normalmente (como siempre lo ahce) el array con las entradas que son "aceptadas" por éste algoritmo...

La pregunta:
¿Como hago eso? :)

Es como que, necesito una CONSULTA SUPER LOGICA...
Tengo 3 opciones:
*Que realmente exista una manera de darle esa logica en la entrada SQL y me quedo feliz..
*Que no exista esa manera de darle logica a SQL y por lo tanto tengo que "recuperar" todas las lineas de la base de datos y compararlas con un algorirmo normal de PHP
*Ponerme a hacer una base de datos que soporte ese sistema de LOGICA y llenarme muy de guita...

^Tifa^

Hola.

Aunque no te he comprendido 100% tu solicitud (Asumo que igual que el resto juas  :xD )
quiero intentar ayudar  :rolleyes:

Tu peticion si puede realizarse enteramente dentro de MySQL sin problema alguno, pero ojo con esto porque tus peticiones requeriran mucho consumo de RAM dependiento el tamanio que utilizaras para ir comparando valor por valor (Tu entiendes).

Se me ha ocurrido lo siguiente, Tengo 2 tablas :

Código (sql) [Seleccionar]


mysql> select * from original;
+--------+---------------+
| codigo | nombres       |
+--------+---------------+
|      1 | Luis Castro   |
|      1 | Pedro Sanchez |
|      1 | Maria Lopez   |
|      1 | Juan Veinte   |
|      1 | Pepe Carlos   |
+--------+---------------+
5 rows in set (0,00 sec)

mysql> select * from archivo;
+---------------+--------+
| palabra       | codigo |
+---------------+--------+
| Pedro Sanchez |      1 |
| Marcia Mama   |      1 |
| Juan Veinte   |      1 |
| Pepe Carlos   |      1 |
+---------------+--------+
4 rows in set (0,00 sec)


Con los datos ahi mostrados. La tabla original es una tabla guardada en motor MyIsam y la tabla archivo es una tabla guardada en motor Memory... la razon que elegi Memory para la segunda es sencillamente que la segunda tabla sera la encargada de alojar los datos que se encuentren en un 'archivo.txt' no quiero registros definitivos, sino temporales y alojados unicamente en la memoria como si fuesen datos dinamicos  ::) por ende la tabla archivo esta en motor Memory. Los datos a la tabla archivo los cargue con el tipico :

LOAD DATA LOCAL INFILE 'ruta/archivo' INTO archivo;

prosigo... tenemos las 2 tablas anteriores, ahora yo quiero guardar en alguna parte dentro de la DB los valores en modo real que vayan insertandose en la tabla archivo y concuerden con la tabla original, entonces hago una vista ::

Código (sql) [Seleccionar]


mysql> create view Ceros as select strcmp(palabra, nombres) as total from original inner join archivo having(total) = 0;
Query OK, 0 rows affected (0,00 sec)



la funcion STRCMP funciona igual que en lenguajes C por ende no creo que deba explicarla mucho, pero si te sirve cuando 2 campos comparados son identicos dicha funcion devuelve valor cero, y como en este caso a mi solo me interesan los valores identicos agrego el predicado having igualandolo a cero, asi solo recogos todos los datos identicos en la comparacion  ;)  para gastar menos memoria a la hora de devolver lol...

Ahora viene la mejor parte del asunto :) cree un procedimiento almacenado, para buscar tu objetivo final (Que hayan mas de 70% de registros similares entre ambas tablas)

Código (sql) [Seleccionar]


mysql> delimiter $
mysql> create procedure proceso(out palabra char(15), out resultado int)
    -> begin
    -> declare valor_original integer;
    -> declare valor_similar integer;
    -> select count(total) into valor_similar from Ceros;
    -> select count(*) into valor_original from original;
    -> select substr((valor_similar/valor_original)%100, 3, 2) into resultado;
    -> if ( resultado > 70 ) then
    -> select concat('Hay un 71% o mayor de similares');
    -> else
    -> select concat('Hay un menor de 70% de similares');
    -> end if;
    -> end;
    -> $
Query OK, 0 rows affected (0,00 sec)

delimiter> ;



Perfecto... ahora el procedimiento lo que hace es siempre recoger los valores totales iguales en la vista Cero (Que al ser una vista siempre estara actualizada en tiempo real a cualquier proceso DDL o DML que se apliquen en ambas tablas  ;) ) y basados en dicho resultados, dividido entre el total de todos los registros que componen la tabla original y sacando un porciento, tendremos un resultado :) en este caso solo tenemos 5 valores identicos a la tabla original que contiene 8 registros por lo que si llamamos al procedimiento proceso tendremos :

Código (sql) [Seleccionar]


mysql> call proceso(@todo, @todito);
+--------------------------------------------+
| concat('Hay un menor de 70% de similares') |
+--------------------------------------------+
| Hay un menor de 70% de similares           |
+--------------------------------------------+
1 row in set (0,00 sec)

Query OK, 0 rows affected (0,00 sec)




Pero si le agregamos mas registros similares a ambas tablas, y luego volvemos a llamar al procedimiento tendriamos ::

Código (sql) [Seleccionar]


mysql> call proceso(@todo, @todito);
+-------------------------------------------+
| concat('Hay un 71% o mayor de similares') |
+-------------------------------------------+
| Hay un 71% o mayor de similares           |
+-------------------------------------------+
1 row in set (0,01 sec)

Query OK, 0 rows affected (0,01 sec)

mysql> select count(total) from Ceros;
+--------------+
| count(total) |
+--------------+
|            8 |
+--------------+
1 row in set (0,00 sec)

mysql> select count(*) from original;
+----------+
| count(*) |
+----------+
|       11 |
+----------+
1 row in set (0,01 sec)




Vas captando mas o menos lo que intento decir  :silbar:

No se si te sirva... espero que si, recuerda que la tabla archivo al estar en motor memory si reinicias, o apagas la DB todos los datos seran eliminados (ya que solo se alojan temporalmente en la memoria ram, asi sacas mas provecho del espacio de ram y accesa mas rapido a los registros).... pero yo te recomendaria que crees un evento CREATE EVENT dentro de MySQL que cada cierto tiempo haga un TRUNCATE a la tabla archivo o cada vez que vayas a LOAD DATA LOCAL INFILE un archivo nuevo le pases un TRUNCATE primero, seguido de un FLUSH TABLES para que limpies la Cache en caso de que uses Cache (Que no te la recomendaria ya que darias mucho uso constante de TRUNCATE) en caso que no uses Cache, pasa cada cierto tiempo un RESET ayuda para desfragmentar...

Intenta si vas a guardar solo caracteres separados de menor de 255 que sean char, ya que longtext o blob o text o similar... la verdad, consume mucho espacio innecesario de memoria y si no vas a dar uso de datos binarios no vale la pena.

Un saludo :)

Skeletron

Wow..
Muchas Gracias..
Me diste a entender principalmente que me tengo que leer un BUEN tutorial de MySQL :)

Muchas gracias.. ya volveré al psot a analizar bin todo eso cuando conozca mas de MySQL