Clasificador de páginas web pornográficas basado en el contenido de las imágenes
La World Wide Web, o simplemente web, es un sistema lógico de acceso y búsqueda de información disponible en Internet cuyas unidades informativas son las páginas web. La web ha facilitado la publicación de gran cantidad de información accesible desde cualquier lugar del mundo; sin embargo, parte del...
- Autores:
-
Ceballos, William Armando
Salazar, Luis Eduardo
Oviedo Carrascal, Ana Isabel
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2009
- Institución:
- Universidad Autónoma de Bucaramanga - UNAB
- Repositorio:
- Repositorio UNAB
- Idioma:
- spa
- OAI Identifier:
- oai:repository.unab.edu.co:20.500.12749/8969
- Acceso en línea:
- http://hdl.handle.net/20.500.12749/8969
- Palabra clave:
- Clasificación de páginas web pornográficas
Máquinas de soporte vectorial
Detección de pornografía
Aprendizaje supervisado
Espacios de color
Rating of pornographic websites
Vector support machines
Detection of pornography
Supervised learning
Color spaces
Pornographic web pages classification
Support vector machines
Supervised learning
Colour spaces
Aprendizaje supervisado
Máquinas de vectores de soporte
Pornografía
Espacios de color
Paginas web
Clasificación de páginas web pornográficas
Máquinas de soporte vectorial
Detección de pornografía
Aprendizaje supervisado
espacios de color
- Rights
- License
- Derechos de autor 2009 Revista Colombiana de Computación
Summary: | La World Wide Web, o simplemente web, es un sistema lógico de acceso y búsqueda de información disponible en Internet cuyas unidades informativas son las páginas web. La web ha facilitado la publicación de gran cantidad de información accesible desde cualquier lugar del mundo; sin embargo, parte del contenido ofrecido como la pornografía, es considerado inapropiado para algunos usuarios. Para aportar al filtrado de pornografía en la web, este trabajo propone el desarrollo de un clasificador de páginas web basado en la evaluación de las imágenes presentes en el contenido de la página. La evaluación de las imágenes es realizada en tres vías: extracción de características de las regiones de piel, análisis de textura y descriptores de forma de la imagen. Los tres tipos de evaluación del contenido de las imágenes son utilizados para entrenar tres clasificadores con máquinas de soporte vectorial (SVM). Los resultados de clasificación son unidos en un ensamble realizado por un metaclasificador por medio de la siguiente política: si al menos uno de los tres clasificadores concluye que la imagen es pornográfica, entonces la imagen es considerada como tal. Al evaluar todas las imágenes contenidas en una página web, se utiliza la siguiente política: si la página web presenta un porcentaje de imágenes pornográficas superior al 30%, entonces la página es considerada como pornográfica. La implementación realizada es evaluada sobre un conjunto de 5000 páginas web diversas, obteniendo una exactitud del 84.6 % en el reconocimiento de contenido pornográfico a través del contenido de las imágenes. |
---|