Noticias

Dropbox incorpora búsqueda de texto en documentos PDF e imágenes

Por segunda vez en apenas dos meses, Dropbox ha mejorado su sistema de búsqueda de tal forma que ahora es capaz de buscar texto dentro de documentos PDF e incluso en archivos de imágenes como PNG o JPG.

Dropbox: busca lo que quieras dónde quieras

Parece ser que esta es la premisa de Dropbox, la popular plataforma de almacenamiento en la nube que durante los últimos meses se ha centrado en mejorar su sistema de búsqueda. El mes pasado la compañía implementó un nuevo motor de búsqueda basado en el aprendizaje automático y ahora anuncia estar mejorando la capacidad de reconocimiento óptico de caracteres (OCR) que permitan al usuario buscar texto tanto en archivos PDF como en imágenes.

«Los formatos de imagen (como JPEG, PNG o GIF) generalmente no son indexables porque no tienen ningún contenido de texto, mientras que los formatos de documentos basados ​​en texto (como TXT, DOCX, o HTML) generalmente son indexables. Los archivos PDF quedan en medio ya que pueden contener una mezcla de texto y contenido de la imagen. El reconocimiento de texto automático de la imagen es capaz de distinguir de forma inteligente entre todos estos documentos para categorizar los datos que contiene.

A pesar de la buena noticia, por el momento esta nueva mejora se encuentra limitada en dos aspectos. Por un lado, parece estar limitada al idioma inglés:

Así que ahora, cuando un usuario realiza una búsqueda de texto en inglés que aparece en uno de estos archivos, se mostrará en los resultados de búsqueda.

Por otro lado, tal y como recoge Jon Porter en The Verge, la función está limitada a los niveles de suscripción más caros.

La nueva característica […] está disponible ahora para los usuarios Dropbox Business Advanced y Enterprise, y debe estar disponible para los suscriptores de Dropbox profesionales en los próximos meses.

El funcionamiento es similar a la tecnología ya implementada en la aplicación móvil de Dropbox el año pasado: utilizar la app para fotografiar un documento, pero ejecutando OCR al mismo tiempo para extraer el texto. Sin embargo, esto solo funcionaba con un pequeño subconjunto de los documentos.

[irp]

Al implementar las capacidades OCR directamente en el motor de búsqueda, ahora Dropbox es capaz de buscar texto dentro de todos sus archivos PDF e imágenes, sin importar la forma en que fueron escaneados o fotografiados.

Recent Posts

  • Android

WhatsApp empieza a desplegar la transcripción de audios

Hace semanas se confirmaba y ahora comienza su despliegue: la transcripción de audios se hace…

2 horas atrás
  • Tarjetas gráficas

RTX 5070 Ti: Revelan posibles especificaciones con unos 8960 núcleos CUDA.

Estas es una de las primeras informaciones que tenemos sobre el modelo RTX 5070 Ti…

2 horas atrás
  • Noticias

Google habría cancelado también la Pixel Tablet 2

Ayer mismo saltaba la noticia de la posible cancelación de la Pixel Tablet 3, la…

2 horas atrás