Intercambio ultraveloz de archivos

Un equipo de investigadores de Estados Unidos ideó un sistema para acelerar el intercambio de archivos a través de internet.

El sistema, llamado Similarity-Enhanced Transfer (SET – Transferencia Aumentada por la Semejanza), se basa en el reconocimiento de fragmentos de datos idénticos y semejantes al archivo requerido.

Millones de archivos se comparten a través de internet.Con él, los investigadores han logrado incrementos de hasta el 500% en la velocidad de intercambio, en relación con los servicios actuales, como BitTorrent.

BitTorrent y otros sistemas similares dividen los archivos en fragmentos y los distribuyen a las personas que realizan esa búsqueda específica.

Pero su velocidad se ve limitada por la cantidad de personas que comparten un archivo determinado, como una canción o un video.

Con frecuencia, si no hay un número suficiente de usuarios conectados a internet que tengan los fragmentos del archivo buscado, la velocidad de suministro es muy baja o nula.

Fragmentos idénticos

“Una gran limitación de BitTorrent es que sólo les permite a los clientes compartir datos si están bajando el archivo exacto”, dijo el catedrático David Andersen, de la Universidad Carnegie Mellon, en Pittsburgh, Pennsylvania, uno de los creadores de SET.

“Esto significa que la reserva de usuarios disponible para cualquier archivo es menor de lo que se necesita”, añadió.

Andersen y los otros dos autores de SET -Himabindu Pucha de la Universidad Purdue, en Indiana, y Michael Kaminsky, de la red de investigación Intel Research- se percataron de que muchos de los archivos que se comparten en internet tienen fragmentos idénticos de datos, aunque parezcan diferentes.

“En retrospectiva, por supuesto, las causas de la semejanza (diferentes archivos de audio, diferentes nombres de los artistas, etc.) tienen mucho sentido, pero honestamente no me lo esperaba”, le dijo Andersen a la BBC.

Jerarquía

SET establece una jerarquía de semejanzas y, entre menor sea el número de éstas que se busque, mayor será la probabilidad de encontrar fuentes con los datos.

“El costo indirecto adicional de localizar estas fuentes no es mayor que el beneficio de usarlas para ayudar a saturar la amplitud de banda del receptor”, señalaron los científicos, en un artículo titulado “Exploiting Similarity for Multi-Source Downloads Using File Handprints”.

“En efecto, el aprovechamiento de fuentes similares puede mejorar significativamente el tiempo de descarga”, añadieron.

SET emplea una técnica llamada “handprinting”, que ya se ha usado para filtrar correos basura.

Por ejemplo, la búsqueda de una canción determinada de Madonna puede arrojar un gran número de títulos porque diversos usuarios la han llamado con diferentes nombres o han cambiado su género u otros datos de clasificación.

SET reconoce que los datos son idénticos, a pesar de los diferentes nombres, y permite que los usuarios compartan fragmentos de esos archivos.

Sistema abierto

En experimentos, SET mejoró el tiempo de transferencia de un archivo de MP3 en el 71% y el intercambio de un video de 55Mb en el 30%.

Andersen dijo que SET podría ser muy útil para encontrar los archivos menos populares.

Según él, también sería fácil adaptar BitTorrent para usar SET como su sistema de búsqueda.

Andersen dijo que espera que los programadores estudien las ideas propuestas en el artículo y las mejoren.

“Me gustaría que la gente se robe esta técnica”, dijo.

El investigador añadió que quiere usar a SET en un servicio para compartir programas informáticos o artículos académicos.

Fuente: BBCMUNDO.com

Leave a comment

Filed under Ciencia, Tecnología

Comments are closed.