Ir al contenido principal

[sql] Búsqueda por palabras en una frase

Holas de nuevo.

Esta vez les he traído un tip especial para principiantes ultra novatos en desarrollo de consultas a bases de datos ^^. Se trata del método que uso para poder hacer consultas a una tabla, filtrando los resultados de acuerdo una frase de búsqueda. Usaré sentencias en TSQL y lenguaje PHP para hacer los ejemplos.

Todos sabemos cómo hacer una consulta teniendo una palabra o frase exacta de búsqueda:

SELECT *
FROM tabla
WHERE campo LIKE '%palabra o frase clave%';

Si queremos aplicar la palabra o frase de búsqueda en varias columnas, la sintaxis sería:

SELECT *
FROM tabla
WHERE campo1 LIKE '%palabra o frase clave%'
OR campo2 LIKE '%palabra o frase clave%';

...añadiendo todas las columnas deseadas a continuación, siempre separando con el OR. Si hubiesen más condiciones de filtro, sería encapsular todos los elementos separados por OR, dentro paréntesis redondo:

SELECT *
FROM tabla
WHERE
campoX = 'valor'
AND
(campo1 LIKE '%palabra o frase clave%'
OR campo2 LIKE '%palabra o frase clave%');

También podríamos realizar la búsqueda en varias columnas concatenadas, si así nos conviene:

SELECT *
FROM tabla
WHERE campo1 + ' ' + campo2 LIKE '%palabra o frase clave%';

Ahora bien, todo esto va perfecto, pero... ¿qué pasa si queremos que la búsqueda usando la "frase clave" se realice buscando cada palabra de la frase, dentro del texto de la columna individual o las columnas concatenadas? Me explico con un ejemplo: la clásica búsqueda de personas mediante su nombre y apellidos.

Tenemos la tabla persona, teniendo varias columnas, y entre ellas: nombre1, nombre2, apellido1 y apellido2.
Esta tabla contiene los siguientes registros:

------- - ------- - --------- - ---------
nombre1 - nombre2 - apellido1 - apellido2
------- - ------- - --------- - ---------
Juan - Antonio - Pérez - Cortés
María - Inés - González - Rojas
Luis - Alberto - Rojas - Morales
Karina - Pamela - Pérez - González
Diego - Juan - Contreras - Pérez
------- - ------- - --------- - ---------

Si en mi buscador yo quisiera buscar a "Juan Pérez", podría hacerlo de cualquiera de las siguientes maneras:

A) Buscador detallado.
Colocar en el formulario de búsqueda una caja de texto para cada uno de los campos a consultar. O sea, una caja para hacer la búsqueda en la columna nombre1; otra, para la columna nombre2; y así etc.

Búsqueda
Primer Nombre :
Segundo Nombre :
Primer Apellido :
Segundo Apellido :

Luego, cuando por programación recupere el valor de las cuatro cajas de texto, podría armar la consulta por programación así:

En lenguaje PHP:

$consulta = "SELECT * FROM persona WHERE ";
$consulta .= (!empty($_POST["nombre1"]) ? " nombre1 LIKE '%".$_POST["nombre1"]."%'": "");
$consulta .= (!empty($_POST["nombre2"]) ? (!empty($_POST["nombre1"]) ? " AND ": "")." nombre2 LIKE '%".$_POST["nombre2"]."%'": "");

Y así continuar con los apellidos, etc...

Ahora bien, ¿qué ocurre si el usuario no sabe si "Juan" es el primer o segundo nombre, y/o lo mismo con el apellido "Pérez"? Más aún, ¿qué ocurrirá si por extraña razón hay una persona a la que han bautizado "Pérez", o que uno de sus apellidos es "Juan"? Etc...

En ese sentido, esta solución, aunque efectiva, resulta aparatosa y engorrosa, tanto para el usuario como el programador.

B) Buscador de Frase Exacta.
Un formulario de búsqueda con una caja de texto única.

Ingrese Palabras : 
Por programación, recibiremos el valor de la caja de texto y podríamos crear una gran consulta donde abarcar la mayor cantidad de alternativas de uso de la frase exacta de búsqueda:

En lenguaje PHP:

$consulta = "SELECT * FROM persona WHERE ";
$consulta .= " nombre1 LIKE '%".$_POST["frase"]."%'";
$consulta .= " OR nombre2 LIKE '%".$_POST["frase"]."%'";
$consulta .= " OR apellido1 LIKE '%".$_POST["frase"]."%'";
$consulta .= " OR apellido2 LIKE '%".$_POST["frase"]."%'";


Incluso podemos aplicar la concatenación de columnas:

$consulta .= " OR nombre1 + ' ' + nombre2 + ' ' + apellido1 + ' ' + apellido2 LIKE '%".$_POST["frase"]."%'";

El resultado, no obstante, no será el esperado, sea cual sea la condición usada. Si las analizamos una por una, tenemos que:

"Juan Pérez" en Nombre1 => Falso
"Juan Pérez" en Nombre2 => Falso
"Juan Pérez" en Apellido1 => Falso
"Juan Pérez" en Apellido2 => Falso
"Juan Pérez" en Nombre1 + Nombre2 + Apellido1 + Apellido2 => Falso

Para obtener los resultados esperados, sería necesario programar desarme de la frase y generar todas las combinaciones de columnas x palabras de búsqueda posibles. Por eso, es mejor pasar directo a la opción C).

C) Buscador de frase, por palabra (ordenado)
Teniendo el mismo formulario de búsqueda que en B), sólo tenemos que cambiar la consulta SQL armada por programación, de modo que la búsqueda sea realizada en todas las columnas, pero tomando todas las palabras de la frase por separado, aunque respetando el orden en el que fueron escritas.

En lenguaje PHP:

$consulta = "SELECT * FROM persona WHERE ";
$consulta .= " nombre1 + ' ' + nombre2 + ' ' + apellido1 + ' ' + apellido2 LIKE '%".str_replace(" ", "%", $_POST["frase"])."%'";

En SQL, la consulta generada tendría la siguiente apariencia:

SELECT *
FROM persona
WHERE nombre1 + ' ' + nombre2 + ' ' + apellido1 + ' ' + apellido2 LIKE '%Juan%Perez%';

Ya que hemos colocado esos comodines entre las palabras de la frase, SQL buscará dentro de la concatenación de columnas, todos los registros que contengan las palabras "Juan" y "Perez" en su interior. El resultado de esta consulta, nos retornará 2 registros:

------- - ------- - --------- - ---------
nombre1 - nombre2 - apellido1 - apellido2
------- - ------- - --------- - ---------
Juan - Antonio - Pérez - Cortés
Diego - Juan - Contreras - Pérez
------- - ------- - --------- - ---------

...ya que "Juan" fue encontrado en el nombre1 del primer registro y en el nombre2 del quinto registro; y "Perez" fue encontrado en el apellido1 del primer registro y en el apellido2 del quinto registro.

Finalmente, si analizamos esta consulta SQL armada por programación, podremos notar que incluso podríamos haber prescindido de dicha programación: aprovechando las funcionalidades del lenguaje de SQL, podemos armar la misma consulta de la forma:

SELECT *
FROM persona
WHERE nombre1 + ' ' + nombre2 + ' ' + apellido1 + ' ' + apellido2 LIKE '%' + REPLACE('Juan Perez', ' ', '%') + '%';


Y si trabajamos netamente en SQL, usando variables TSQL, también podría quedar:

DECLARE @frase VARCHAR(255);
SET @frase = 'Juan Perez';
SELECT *
FROM persona
WHERE nombre1 + ' ' + nombre2 + ' ' + apellido1 + ' ' + apellido2 LIKE '%' + REPLACE(@frase, ' ', '%') + '%';


¡Esto nos ayudará mucho si trabajamos las búsquedas dentro de procedimientos y/o funciones almacenadas!

Observación:
Es importante recalcar que la forma de separar la frase, explicada con anterioridad, asume que queremos buscar las palabras en el mismo orden en que fueron escritas las palabras de la frase la primera vez.

Si por alguna razón quisiéramos que no tomara en cuenta el orden, y que buscara indistintamente por todas las palabras, tendríamos que separar previamente por programación cada palabra de la frase y repetir la condición de búsqueda por cada palabra encontrada.

Esto lo podemos hacer por programación:

En lenguaje PHP:

$consulta = "SELECT * FROM persona WHERE ";
$palabras = explode(" ", $_POST["frase"]);
$c = 0;
foreach ($palabras as $palabra)
{
$c++;
$consulta .= " nombre1 + ' ' + nombre2 + ' ' + apellido1 + ' ' + apellido2 LIKE '%".$palabra."%' ";
$consulta .= (count($palabras) == $c ? "": " OR ");
}

Lo que daría por resultado:

SELECT *
FROM persona
WHERE
nombre1 + ' ' + nombre2 + ' ' + apellido1 + ' ' + apellido2 LIKE '%Juan%'
OR nombre1 + ' ' + nombre2 + ' ' + apellido1 + ' ' + apellido2 LIKE '%Perez%';

Para hacerlo por SQL, podrían valerse de la forma que explico en mi tip Pasar array a parámetro de procedimiento almacenado, aunque sólo es efectivo cuando las columnas contienen un solo valor (una palabra sola o una frase que sea no-separable, como nombres compuestos, etc.).

Si existe una forma correcta de hacerlo en SQL, sería bueno leerlo en los comentarios ^_^ Al menos por ahora no conozco una función tipo split o explode en SQL.

Y eso sería. Resultó largo de explicar, pero espero que les sirva de alguito ^^.
Saludos y gracias por leer!

Comentarios

Entradas populares de este blog

[tsql] Error: La instrucción INSERT EXEC no se puede anidar

Holas a todos. Mientras programaba un procedimiento almacenado, intenté obtener los datos de otro procedimiento, como lo he venido haciendo desde que descubrí tamaña maravilla de la programación sql. Pero hoy me topé con este extraño error: La instrucción INSERT EXEC no se puede anidar . Tras investigar por algunos lados, di con la respuesta: no se puede almacenar en una tabla temporal de procedimiento almacenado, el resultado de otro procedimiento que también esté realizando una inserción de este tipo. Esto es algo como tener: CREATE PROCEDURE miProcedimiento AS  INSERT INTO #tablita EXEC otroProcedimiento;  SELECT * FROM #tablita; END; CREATE PROCEDURE nuevoProcedimiento AS  INSERT INTO #tabla1 EXEC miProcedimiento; END; Esto significará que si ejecuto: EXEC nuevoProcedimiento; ...SQL me arrojará el error antes mencionado. La solución al problema es no llamar a un procedimiento que esté llamando a otro ya en su interior. En algunos lados leí que transf

[mysql] Pasar array a parámetro de procedimiento almacenado (Mysql)

Me tocó hacer una consulta que retornaba una lista de items relacionados con una lista de usuarios que podían o no tener registros en común (vale decir, tabla de quiebre). La lista debía retornar siempre la lista de items, independiente de si había usuarios por los cuales consultar y/o si los usuarios tenían relación con ellos, pero debía mostrarme el status de los usuarios por cada item, de haberlos, esto es, una lista de nombres con una columna que podía estar vacía o no. Para el caso de tener que consultar los items relacionados con usuarios, al hacer la consulta utilizando un LEFT JOIN, me daba resultados si los usuarios tenían relación con los ítems, pero no si los usuarios no tenían items asociados pues, obviamente, al no estar relacionados, la consulta retorna vacío. Por ello, la solución era hacer la consulta de los items primero, y luego por cada item preguntar el status del usuario por cada uno. Para ello, tenía dos alternativas: hacerlo por programación o hacerlo por bas

[php] NuSOAP HTTP Error: socket read of headers timed out

Holas a todos. Este es para comentar un problema que he tenido al trabajar un servicio web montado en PHP con la clase NuSOAP. El problema surgió cuando intenté llamar al servicio web desde el otro servidor, pero se caía a los exactos 30 segundos de ejecución, mostrando el mensaje que titula este registro: HTTP Error: socket read of headers timed out Sabía que el problema era el timeout, pero ¿el timeout de qué? En los servidores y páginas web hay timeouts por todos lados: el de la Conexión a internet o la red, el del Servidor (hardware), el del Servidor Web en sí (Apache, mi caso), el de PHP (mi caso)... Pero nunca se me habría ocurrido que las Aplicaciones o frameworks también pudieran tener :o Por eso, tras buscar por la red la solución a mi problema, la respuesta vino precisamente de alguien que señaló sencillamente que había que modificar el timeout de la clase NuSOAP. Y dicho y hecho, eso solucionó el problema. Si están usando en su servidor y/o cliente la clase NuSOAP, y d