Image quality assessment based on full–referenced perceptual measures
La presente tesis muestra un sistema de evaluación de la calidad en imágenes basado en medidas perceptuales. El uso de evaluaciones del tipo perceptual permiten que los sistemas,encargados del monitoreo de procesos industriales a través de imágenes, puedan dar evaluaciones que se aproximen a la de u...
- Autores:
-
García Álvarez, Julio César
- Tipo de recurso:
- Doctoral thesis
- Fecha de publicación:
- 2011
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/9114
- Palabra clave:
- 62 Ingeniería y operaciones afines / Engineering
Evaluación de la calidad
transformada Onditas, medición de distorsión
extracción de características
procesamiento de imágenes
sistema visual // Quality assessment
wavelet transforms
distortion measurement
feature extraction
image processing
visual system
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
Summary: | La presente tesis muestra un sistema de evaluación de la calidad en imágenes basado en medidas perceptuales. El uso de evaluaciones del tipo perceptual permiten que los sistemas,encargados del monitoreo de procesos industriales a través de imágenes, puedan dar evaluaciones que se aproximen a la de un experto. Esto cumple con los siguientes objetivos: Primero, proveer una alta correlación entre los valores medidos usando esta evaluación y los valores observados por seres humanos sobre la misma imagen. Por último, reducir el costo computacional usado para la evaluación, gracias a que las etapas de procesamiento al interior de su algoritmo usan la misma representación de procesamiento de la imagen. Este último aspecto conlleva a proponer la inclusión de este sistema de evaluación como parámetro para una estrategia de control de distorsión sobre algoritmos de codificación de imágenes. El método de evaluación de la calidad en imágenes propuesto se llama Índice de Calidad Completamente en Onditas (IC–CO). Este método se basa en el uso de una combinación de medidas, las cuales se calculan en el espacio multi–resolución de onditas. El uso de este espacio busca obtener una alta correlación con el modelo de visión humano y reducir el número de procesos involucrados con el cálculo de medidas perceptuales. Este método utiliza la misma representación del proceso de imágenes, para evitar la extracción de cada característica usando una operacion diferente, convirtiéndose esto en una carga adicional para la evaluación. Como entonces no se utilizan las funciones óptimas requeridas para extraer adecuadamente las características perceptuales, existe un problema de inexactitud en la medida. Sin embargo, se demostrará experimentalmente que la exactitud de la evaluación no se ve afectada, siempre y cuando se use una selección adecuada de parámetros. El Capítulo 1 introduce el problema relacionado con la evaluación de la calidad en imágenes. Aquí se desarrolla la metodología de evaluación de calidad en imágenes. Para ello, un resumen de los antecedentes se presenta en relación con los métodos de evaluación y sus parámetros. Además, se describen también los objetivos y el alcance de esta tesis. El Capítulo 2 brinda los aspectos teóricos acerca de la evaluación de la calidad en imágenes, para describir cómo la calidad es medida sobre una imagen que está codificada para poder ser transmitida. En concreto, una imagen médica puede distorsionarse al pasar a través de un proceso de codificación con pérdidas para encajar con la limitación de ancho de banda de transmisión. Esta explicación tiene la intención de describir los elementos necesarios para dar un puntaje equivalente a la percepción humana. Además, este capítulo incluye una descripción teórica de la representación a ser usada, brindando una visión general de las representaciones multi–resolución. El Capítulo 3 constituye el núcleo de nuestra propuesta y contribución. Este capítulo está dedicado a la descripción de la IC–CO. Los procedimientos para el cálculo de las medidas y filtros relacionados con esta evaluación se basan en los principios del análisis funcional y modelos inspirados en el ojo humano. Aunque las evaluaciones se utilizan para una amplia gama de distorsiones, la única distorsión considerada es la generada por el proceso de codificación de la imagen. Es decir, la imagen a evaluar está distorsionada debido a un proceso de codificación. Así, el nivel de distorsión medido se convierte en un parámetro de evaluación del rendimiento para estos procesos. Para un valor específico de tasa de transmisión, cada codificador entrega una imagen con diferentes tipos y niveles de distorsión. Por tanto, el desempeño de estos codificadores puede ser medido mediante la evaluación de la calidad sobre la imagen correspondiente. Como resultado de esta evaluación, la imagen que entregue el menor valor de distorsión implica que su codificador correspondiente tiene el mejor desempeño en comparación con los demás. Así, nuestra propuesta está motivada por la necesidad de seleccionar una representación, de tal manera que se obtenga un enriquecimiento o mejor uso de la información que se obtiene de la imagen codificada. Este enriquecimiento de la representación, a lo que llamaremos generalización, es particularmente pertinente cuando hay limitaciones en la representación. Sin embargo, esta generalización puede presentar una pérdida en la precisión de la medida. Una primera aproximación se describe en el Anexo A para Descomposición en Arboles de Quadratura. Sin embargo, la representación en onditas es seleccionada finalmente. El Capítulo 4 determina la metodología para realizar los ajustes sobre el algoritmo de IC–CO, de tal manera de corregir la pérdida de precisión debida al uso de la generalización. Estos ajustes son validados usando la correlación y la sensibilidad con respecto a evaluaciones humanas realizadas sobre las mismas imágenes de prueba. Con esto se demuestra experimentalmente que la evaluación propuesta logra resultados comparables con otros en correlación con modelos de evaluación humana, a pesar del problema producido por la generalización. Para tal caso, se selecciona una estrategia de regresión adecuada para obtener un incremento en la correlación con el modelo humano. Por lo tanto, este capítulo describe la prueba experimental para la realización de los ajustes sobre los parámetros. Estos parámetros son los siguientes: Función de Sensitividad de Contraste, Medidas Perceptuales y Estrategia de Regresión Lineal. Para los dos últimos, la correlación se mide por el coeficiente de determinación. Se utiliza una base de datos normalizada para el ajuste, y para propósitos de comparación. En el capítulo 5, el Índice de Calidad basado Completamente en Onditas (IC–CO) se utiliza para dos propósitos: Primero, para dar una prueba de desempeño de una clase especial de codificadores, denominados Codificadores de la Región de Interés, usando imágenes médicas como base de datos; Segundo, para sugerir que la evaluación IC–CO puede implementarse como parámetro de control de calidad sobre los codificadores. Así, se propone que las evaluaciones basadas en medidas perceptuales son adecuadas como evaluadores del desempeño en codificadores, así como como parámetros de estrategia de control para los mismos. Finalmente, el Capítulo 6 concluye con los trabajos futuros en clasificación y reconocimiento de patrones / Abstract: This work illustrates a proposed image quality assessment based on perceptual measures, an evaluation that can be used for different applications with limited computational loads. It aims to emulate the human vision for evaluation purposes by using perceptual measures. Examples of applications are medical image coding, machine fault identification, texture classification in the carpet industry, and facial recognition. Perceptual measures are calculated on the wavelet space, generating a scheme which can extract features such as frequency, position, and textures, all taken from one image at the same time. This scheme is called multi-resolution, where features of higher orders of complexity can be calculated, such as edges, transitions, and homogeneities. The proposed assessment is composed of the following elements: a filter, a set of measures, and a summation function. The filter is used to enhance the image features at perceptible frequencies to the human eye. This filter is known as Contrast Sensitivity Function. The measures are used to numerically describe how the features change through distortion. The summation function parameters are calculated by a regression strategy, whose adequate selection widens the range of measurement. The proposed image quality assessment is called Full–Wavelet Quality Index (FW–QI), which is intended to be highly correlated with human vision models and also to reduce the number of processes involved in the calculation of perceptual measures, by using the same representation of the imaging process. However, due to this capability, the measuring accuracy must be addressed. This document will show that the accuracy and sensitivity of measurement are not affected, by using an appropriate selection of parameters. Chapter 1 introduces the reader to the problem of image quality assessment, presenting a description of the research work for the development of the proposed methodology. Accordingly, a background summary on assessment methods and their parameters is presented. The work is shown and justified in further chapters, where the objectives and scope of this thesis are described. Chapter 2 presents the theoretical aspects of Image Quality Assessment, in particular how quality is measured on an image that is encoded for transmission purposes. For instance, when a medical image is distorted when it passes through a lossy coding process to fit bandwidth constrains. This explanation aims to describe the elements required for a perceptual scoring. An overview on multi–resolution representations is shown, including the theoretical description of used representation. Chapter 3 constitutes the core of the proposal and contribution. This chapter is dedicated to the description of the FW–QI assessment. The procedures for calculation of perceptual metrics and filters are based on the principles of functional analysis and human–eye inspired models. Although assessments are used for a wide range of distortions, the source of distortion considered here is that generated from coding – i.e. where the measured image is distorted after passing through a coding method. The measured distortion level is then turned into a performance assessment parameter for coders. At a specific transmission rate, each coder outputs an image with different types and levels of distortion. Therefore, performance of such coders can be measured by quality assessment on output encoded image. As a result of the assessment, the image that gives the lowest distortion value implies that the related coder has the best performance. Thus, the proposal is motivated by the need for selecting an adequate representation such that more information can be obtained from the same representation of encoded image. Such an enrichment of the representation — or generalization— is particularly pertinent when there are representational limitations. A first attempt is described in Appendix A for Quad–tree Decomposition. Thereafter, wavelet representation is finally selected. Chapter 4 describes the methodology for the adjustments made on FW–QI algorithm, which improves the measurement accuracy, and corrects the generalization problem. The adjustments are validated using the correlation and sensitivity with respect to human–based evaluations made on test images. It is experimentally demonstrated that the proposed assessment achieves a high correlation value with human–based models, despite the accuracy problem presented by generalization. This value is achieved mainly by the selection of an adequate regression strategy, where an experimental test is carried out to give the adjustments required for those parameters. These adjustments are made on the Contrast Sensitivity Function, on the Feature Measures and on the Linear Regression Strategy. Correlation is measured by coefficient of determination. The standardized LIVE database is used for adjustment, and for comparison purposes. In Chapter 5, the FW–QI assessment is used for two purposes: first, to give a performance evaluation of a special type of encoders (see Appendix B), using medical images as database; second, to implement this assessment on a coding control scheme. The intention of this test is to show that FW–QI is suitable for use as a coder performance evaluator, such as parameter for a distortion control strategy within these coders. The test is arranged in the following manner: an image is encoded by several considering methods, resulting in a number of encoded images equal to the number of selected methods. Later, each encoded image is evaluated by FW–QI, and other assessments by three approaches: An assessment made on whole image, another made on an arbitrary selected region of interest, and the last made as a quality ratio between region of interest and background. Finally, the performance of several coding methods are evaluated based on the results of the assessment approaches. Finally, Chapter 6 concludes with future works on classification and pattern recognition applications |
---|