sql: joins vs multiple selects

Pese a que el saber popular dice que hacer un select multiple*(1) versus un select con joins*(2) es mas lento.

*(1) SELECT link_id,sum(vote_value) FROM links,votes WHERE link_id=vote_link_id AND vote_type=’links’ AND vote_value>0 AND link_date > DATE_SUB(NOW(), INTERVAL 1 year) GROUP BY link_id
*(2) SELECT link_id,sum(vote_value) FROM links INNER JOIN votes ON (link_id=vote_link_id AND vote_type=’links’ AND vote_value>0) WHERE link_date > DATE_SUB(NOW(), INTERVAL 1 year) GROUP BY link_id

Para sacarme la duda cree una script que crea usuarios, enlaces, comentarios y votos (positivos y negativos) en meneame.

Luego tome las diferentes queries que usaban multiples tablas para el calculo del karma (el archivo /scripts/karma9.php) y las compare con las joins, en todas las consultas agregue el prefijo SQL_NO_CACHE

El resultado final contra todo lo que esperaba fue no concluyente…
Seletcs multiples total took: 587
Selects joins total took: 600

Como no me gusta rendirme facilmente elimine todos los indices y corri de nuevo los test. Obteniendo el siguiente resultado;
Seletcs multiples total took: 118023
Selects joins total took: 117221

A tener en cuenta, las consultas siempre fueron hechas entre dos tablas, si fueran de mas tablas segun la documentacion de sql: nested joins

Conclusion
Como conclusion podemos afirmar que los indices vamos a lograr consultas muy rapidas, pero esto se paga, los inserts, deletes y updates de una campo indice van a ser mas lentos, debido a que los indices deben ser regenerados. Tambien se paga con espacio ya que los indices ocupan memoria.

Anuncios

Que tan ineficiente puede ser incrementar un valor de un modelo

Estoy trabajando para refactorizar el codigo de meneame usando el framework cakephp.

Hoy me encontraba haciendo la logica para votar una noticia y me encontre con el problema de tener que hacer una query simple;
UPDATE `links` AS `Link` SET `Link`.`link_anonymous` = link_anonymous+1 WHERE `link_id` = 1

Esto se logra haciendo desde el modelo;
$this->updateAll(array(‘link_anonymous’=>’link_anonymous+1’),array(‘link_id’=>1));

Pero al hacer en vez de hacer el update simple que escribi mas arriba hace un update con todos los joins de los modelos;
UPDATE `links` AS `Link` LEFT JOIN `users` AS `User` ON (`Link`.`link_author` = `User`.`user_id`) LEFT JOIN `blogs` AS `Blog` ON (`Link`.`link_blog` = `Blog`.`blog_id`) LEFT JOIN `categories` AS `Category` ON (`Link`.`link_category` = `Category`.`category_id`) SET `Link`.`link_anonymous` = link_anonymous+1 WHERE `link_id` = 1 AND `limit` = ‘1’

Este update es muy costoso, intente usando las funciones del modelo saveField y save, pero no entienden el mensaje ‘link_anonymous+1’, lo transforman a 1 y yo quiero que hagan link_anonymous+1

Para solucionar este problemita agregue la funcion update, que elimina las asociaciones entre el modelo que queremos actualizar y luegos las agrega nuevamente, de esta forma el UPDATE vuelve a ser simple.

La funcion fue tomada de http://blog.pepa.info/php-html-css/cakephp/getting-rid-of-joins-in-updateall-query/

agregar a #app_model.php
/**
* A workaround for CakePHP lack of support for recursive
*/
function updateAll($fields, $conditions = true, $recursive = null) {
if (!isset($recursive)) {
$recursive = $this->recursive;
}

if ($recursive == -1) {
$this->unbindModel(array(
‘belongsTo’ => array_keys($this->belongsTo),
‘hasOne’ => array_keys($this->hasOne)
), true);
}

return parent::updateAll($fields, $conditions);
}

Luego hago;
$this->updateAll(array(‘link_anonymous’=>’link_anonymous+1’),array(‘link_id’=>1),-1);

y… voila!
UPDATE `links` AS `Link` SET `Link`.`link_anonymous` = link_anonymous+1 WHERE `link_id` = 1

EDITO: hoy agregue un ticket al equipo de desarrollo de cakephp… a ver que contestan