Odio Internet Explorer (URLs de longitud larga).

 

Siempre he odiado a Microsoft, quiza hoy más que nunca debido a que perdió mi equipo favorito de futbol: Las chivas.

 

Pero bueno, vamos por partes ¿hoy por qué odio a microsoft y concretamente a Internet Explorer?

 

Para que puendan entender mi frustración, explicaré poco a poco las cosas.

 

Introducción: algo de HTML

 

Un TAG escencial y bastante común en HTML es el IMG, el cual sirve para incrustar una imagen en una página web. Dicho TAG tiene al menos un atributo sumamente importante, el atributo SRC, el cual apunta a la imagen (posiblemente remota) que será descargada por el navegador y luego rendereada (dibujada en pantalla).

 

Caso trivial:

 

<IMG SRC="http://upload.wikimedia.org/wikipedia/commons/6/68/Gianna-michaels.jpg&quot; ALT="Gianna Michaels"/>

 

Algunos atributos adicionales (entre muchos otros) son WIDTH y HEIGHT, siendo útiles si deseamos que el browser calcule su espacio en altura y anchura y acomode sus dimensiones en la página ántes de que la imagen sea completamente descargada (interesante si la imagen es de varios KBs).

 

Hasta aquí nada fuera de lo normal.

 

Imágenes generadas dinámicamente en el servidor.

 

En el ejemplo anterior descargamos una imagen, de forma remota, y dicha imagen es un archivo, estático, pero el TAG IMG nos permite indicar a algúna pagina PHP o a un sevlet o “algo” que se le parezca, para que realice procesos en el servidor y genere alguna imagen de forma dinámica, es decir, que no apunte a algun archivo en el servidor.

 

Para los iniciados en PHP una liga que toca el tema es la siguiente:

http://devzone.zend.com/node/view/id/1269

 

Para los fanaticos del Java, aquí van dos interesantes ligas que explican el concepto:

http://java.sun.com/developer/JDCTechTips/2001/tt0821_update.html

http://www.javaworld.com/javaworld/jw-05-2000/jw-0505-servlets.html

 

Si alguien se pregunta “¿para qué es útil generar imágenes en el servidor?” la respuesta es bastante obvia: una de tantas aplicaciones son gráficas (charts) que muestren indicadores de algún porcentaje formado por datos actuales de consultas en un DBMS.

 

Comienzan los problemas

Es sumamente común pasarle argumentos a la página PHP o al java servlet que generará la gráfica. Dichos parametros pueden indicar tamaño, datos, tipo, todo lo que el programador desee.

 

Los parametros van indicados dentro de la URL, es decir, utilizando el método GET.

 

Si desean mayor información de GET vs POST aquí van las ligas que lo explican:

http://www.cs.tut.fi/~jkorpela/forms/methods.html

http://www.w3.org/TR/html4/interact/forms.html#submit-format

 

Sencillamente para obtener una imagen dinámica utilizando la etiqueta IMG se hace con GET y punto, no hay mayor discusion.

 

Por ejemplo, supongamos que tenemos un servlet que generará una imagen, dicho servlet recibirá parametros param1 param2 con sus respectivos valores, dichos parámetros supongamos que son necesarios para la generacion de la imagen:

 

<IMG src="/mywebapp/myimageservlet?param1=value1&param2=value2"/>

 

La vida es maravillosa en éste punto, se abre una infinidad de posibilidades para el desarrollador de aplicaciones web: contenido dinamico incluso en las imágenes (y no me estoy refiriendo a animaciones).

 

Microsoft y en esta ocasión los desarrolladores de IE explorer y piensan que debe haber límites.

 

Uno como programador a veces abusa de las posibilidades, y a veces nos gusta abusar de ellas. Por diseño de la aplicación, queremos pasarle todos los datos al generador de gráficas que con tanto ainco (esfuezo, ignorante) se programó para que no accese directamente a la DB, sino que en su lugar, solo procese parametros y genere la gráfica deseada.

 

Pero sucede que IE trunca las URLs!!!…

http://support.microsoft.com/kb/208427

 

A pesar de que oficialmente en la especificación del Hypertext Transfer Protocol — HTTP/1.1 jamas menciona límites para las URLs, Microsoft decidio que 2083 caracteres son suficientes, mientras que todos los demas navegadores no tienen problema alguno sobre ellas.

 

Una discusión interesante al respecto esta en el siguiente blog:

http://www.boutell.com/newfaq/misc/urllength.html

 

En dicho blog menciona la posibilidad de comprimir la URL, algo que ya se me habia ocurrido a mi pero que me resistia a codificar (más adelante explicaré el motivo).

 

Rápido, un ejemplo!

 

Yo bien nice programando mi servlet, sucede que exageré un poco al generar la siguiente URL:

 

<IMG SRC=’http://WWW.XXX.YYY.ZZ/thecaMonitoringWeb/ GraficaPie?typeGraph=cmPorcentajeModelos&width=800&height=500&totalModelos=40&modelo0=DCM245&totalModelo0=255&modelo1=SB5120&totalModelo1=10&modelo2=DOCSIS+1.1+Touchstone+Cable+Modem+Model+CM450A&totalModelo2=851&modelo3=EtherFast+Cable+Modem+(BEFCMU10)&totalModelo3=83&modelo4=ARRIS+DOCSIS+2.0+%2f+PacketCable+1.0+Touchstone+Telephony+Modem+MODEL%3a+TM402G&totalModelo4=224&modelo5=SBG900&totalModelo5=5&modelo6=SB4200&totalModelo6=13&modelo7=Terayon+TJ%7cECM+715X&totalModelo7=3&modelo8=DOCSIS+1.1+Touchstone+Cable+Modem+Model+CM300A&totalModelo8=378&modelo9=DCM305&totalModelo9=271&modelo10=D-Link+DOCSIS+2.0+Cable+Modem+MODEL%3a+DCM-202&totalModelo10=5&modelo11=PCX2200&totalModelo11=4&modelo12=SB4100&totalModelo12=9&modelo13=Ambit+DOCSIS+Cable+Modem+Model%3a+60194E&totalModelo13=11&modelo14=DCM235&totalModelo14=55&modelo15=(General+Instrument)+Motorola+SB2100%2fD%2fi&totalModelo15=1&modelo16=(General+Instrument)+Motorola+SB3100&totalModelo16=40&modelo17=WebSTAR+Series+DPC2100&totalModelo17=1109&modelo18=ARRIS+DOCSIS+2.0+%2f+PacketCable+1.0+Touchstone+Telephony+Modem+MODEL%3a+TM502G&totalModelo18=362&modelo19=Com21+DOCSIS+1.0+Cable+Modem+Model%3a+DP111&totalModelo19=1&modelo20=CMX2940%2f3CR29210+MCNS+DOCSIS+1.0+external+2-way+Cable+Modem&totalModelo20=35&modelo21=Belkin+MODEL%3a+F5D5530-W&totalModelo21=1&modelo22=D-Link+DOCSIS+1.1+Cable+Modem+MODEL%3a+DCM-201+(discontinued%2c+replace+with+DC&totalModelo22=1&modelo23=Modelo+desconocido&totalModelo23=4&modelo24=Tollgrade+Cheetah+HFC+Service+Assurance&totalModelo24=1&modelo25=PCX1100U%2fDAZ8813&totalModelo25=4&modelo26=DCM226&totalModelo26=1&modelo27=SB5101&totalModelo27=5&modelo28=DCM225&totalModelo28=25&modelo29=SB5100&totalModelo29=10&modelo30=DOCSIS+1.1+Touchstone+Cable+Modem+MODEL+CM550A&totalModelo30=1386&modelo31=WebSTAR+Series+DPX2100&totalModelo31=1&modelo32=Com21+Model%3a+DP1110&totalModelo32=21&modelo33=PipeRider+HM200c&totalModelo33=2&modelo34=PCX2600&totalModelo34=3&modelo35=Thomson+DOCSIS+Cable+Modem+MODEL%3a+DCM315&totalModelo35=20&modelo36=Thomson+DCM425&totalModelo36=1&modelo37=PCX2500&totalModelo37=1&modelo38=UBR925-K9O3SV9Y5-M&totalModelo38=1&modelo39=ARRIS+DOCSIS+1.1+%2f+PacketCable+1.0+Touchstone+Telephony+Modem+MODEL%3a+TTM202&totalModelo39=2&sumaTotal=5215’ WIDTH="800" HEIGHT="500" ALT="Porcentajes de modelos"/>

 

La longitud de la URL en el atributo SRC fue de 2,301 caracteres y me sucedió lo que al plátano.

 

Todo funcionaba perfectamente, el servlet, las librerias gráficas, en Opera, FireFox, hasta consegui probarlo en Safari!!! (Mac OS X).

 

Pero en el IE 7 me truncaba la maldita URL a 2,048 caracteres (mentira que fueran 2,083).

 

Comienza la frustracion

 

Despues de devorarme varios RFCs, me di cuanta que:

  • No existe forma de alterar el comportamiento GET al solicitar una IMG.
  • Mediante JavaScript, el objeto Image, sencillamente no tiene metodos o atributos para especificar (establecer) los datos binarios (contenido) de una imagen.
  • El AJAX tan famoso de hoy dia, funciona principalmente para texto y XML, aunque hay workarounds para forzarlo y halar (si, se escribe con h y se pronuncia con j) un flujo binario: http://mgran.blogspot.com/2006/08/downloading-binary-streams-with.html

 

El último punto fue brevemente alentador, y de hecho pude cargar todo el flujo binario de la imagen, mediante POST!, ahí parecia que tantas horas de googlear habian rendido fruto, jajaja pero surprise surprise, una vez que tenia el contenido de la imagen no hubo poder humano que me ayudara a depositarlo de alguna forma en el render del browser para que la mostrara (punto número 2).

 

 

Maldito IE, otra vez

 

Precisamente ahondando más en el segundo punto (generar la imagen, pero esta vez en el cliente –es decir, la imagen ya la tenia en memoria-) provocó varios golpes en la pared, pero desenvoqué en algo sumamente interesante: data:URI:

http://es.wikipedia.org/wiki/Data:_URL

http://www.hackszine.com/blog/archive/2006/11/rfc_2397_embed_image_data_insi.html

 

 

En resumidas cuentas, data:URI era lo que yo deseaba: reconstruir la imagen a partir del flujo de datos, sin referenciar a un servlet, lo que evitaba que el browser realizara el GET y en consecuencia IE truncara la URL.

 

Por ejemplo, lo siguiente representa a la rana rené (Kermit) con un sable lazer de star wars:

<img src=’’/>

 

data:URI es un estandar desde 1998 (IETF standard RFC 2397), y que a la fecha, Microsoft se ha resistido a soportar, por tanto lo anterior funciona en TODOS los navegadores, excepto en IE.

 

¿Solución?

Llegue al punto que no queria llegar, comprimir la maldita parte de la URL de los parametrosL.

 

Me encontré con una interesante clasesilla en Java que hace la chamba de codificar y comprimir flujos de datos:

http://iharder.sourceforge.net/current/java/base64/

 

Tuve algunos problemas, puesto que algunos caracteres base64 no son URL safe, lo que significa que no son correctamente enviados por el jodido método GET.

 

Asi que despues de codificarlos en base64 y comprimir el flujo, nuevamente lo codifiqué utilizando un URL UTF8 Encoder.

 

En el ejemplo anterior, en el que yo deseaba una URL de longitud 2,301, aplicando esta técnica, quedo de 1,204 caracteres!:

 

http://www.xxx.yyy.zz/thecaMonitoringWeb/GraficaPie?encBase64GZip=H4sIAAAAAAAAAK2VzW7bOBDHeynQF0mQgnBBDkl9HOZgy07abbUxbGWb9qbIbKWNLBkSvdm8077IPsy+w1KOKYtKsR9FDzYEzW/+w5nhjP7468VL/epP/bhTV026yzHbLusmU5VOf1VxvVFl3Z4/FBudY0Dpea6Kr7lGaR51rdPySKCg59vDI8WkLsuvTbpRJMqV0mlO3l5GZK2a34pMkWnb7pu0ytTQnyI7ujOcqfK+qEh8PV98OOMpuZRzKTmdfBw6sN4BcLq9KzSZX0frd2sSpXelIh20PfyXnYRHWSgWQ39Axo8CHOeTD0V1bxXgDXVV7EHmUTwBCkMZjvKoIkYq7A37JxVGLjZFm9WVLqq92pxBRhq1K1NToIdC54YahhF9thIT1aSPdUWSn878bBHFxGfydghLtJl5uIxuGaP05gy+zKefg8AkPSA9FEfS70jw3Kb6vVBwMI96HvSHCg9mcM1hL87MlcjrbWsObZIXIJ1GDlrPTtw3mjkoIGeuBkOw148BdgB1AUAIeoJ3BAiX4AgysIQ4ENwlBErPAvIAgOcA8pSJ92R3BTwEW1Dm40d1t06mq24uCtWS+fIWmFtBA/WCwXM+esabjjBhLyQLcaFz1VymrXYKeTFbXEbxDaOvHecQA5s/UFzPrkJX3by00sCMXTJw7WYkwQJwAChzADgJ8Ce7K8DN8S0gDCBGN8q8ZPZOgeyAsYLE0No9vLhSlZmVkryrWt3st2ajvTYl0HVTlylZz/jY20Peu/v/6t5Vvxsr8yscmVPXwMxNsVOrYqMa8jY26WQOGWBfsBCjegvstD3otzfZfMmYW9WwD8fpUcSlnSQNAz3P8Ga2CkFO3ofXfP1L+ElOYgc+bVlu1uxqZU42WJImc7JMs3uln47aHTqp91ne6rpSJFGl2uV19Tge4CSWFK6cQIDc70PxHxlKjEOZQQffhhJuqG5pf3eoJB5/HETfX24WxinEQO7ZhiNRLCWdOjpmsQi/l/L+i1SHGikxlvIw8Prs/f+hxOlIyXwdAjsuPMAovoVQdBPBoxWEZjpIHP28Hl5o9btWTWUmCiYP6eMwiiMcILd7lof49JJsVPexrLNiUztwaErc7rdp0r1DyUPvb76PtNTQCAAA

 

Y funcionó. Pero no es una solución adecuada, ya que el límite esta ahí presente, nada asegura que comprimiendo la URL siempre estara por debajo de los 2048 caracteres, sencillamente no es una solución aceptable para futuras aplicaciones. Pero demonios, no he encontrado algo mejor.

 

Algunas otras soluciones estúpidas que he encontrado es halar el contenido de la imagen, como no se puede reconstruir un objeto IMG como tal en la página, entonces reconstruirla utilizando tablas, donde cada pixel representa una celda K:

http://neil.fraser.name/software/img2html/

http://neil.fraser.name/scripts/img2html.pl?img=http%3A%2F%2Fupload.wikimedia.org%2Fwikipedia%2Fcommons%2F6%2F68%2FGianna-michaels.jpg&cmd=Convert

 

Pero eso incrementa hasta en un 200% o más la cantidad necesaria para reconstruir la imagen!!, ademas de que en los ensayos que realicé, los browsers tardan demasiado en renderear toda la tabla y el consumo de memoria RAM en el cliente es inombrable.

 

Estoy empezando a creer que necesito vida social.

 

Sincerely yours…