ARTÍCULO ORIGINAL

 

Modelo computacional para la estimación de la densidad del suelo a través del sensoramiento continuo

 

Computational Model to Predict Soil Density Using Machine Learning Methods

 

 

Darina Lara CobaI; Miguel Herrera SuárezII; María Matilde García LorenzoIII; Roberto BeltranIV

IUniversidad Tecnológica de la Habana José Antonio Echeverría, Facultad de Ingeniería Mecánica, Departamento de Mecánica Aplicada, Marianao, La Habana, Cuba.

IIUniversidad Técnica de Manabí (UTM), Facultad de Ciencias Matemáticas Físicas y Químicas, Escuela de Mecánica, Portoviejo, Manabí, Ecuador.

IIIUniversidad Central “Marta Abreu” de Las Villas, Grupo de Inteligencia Artificial, Centro de Investigaciones Informáticas, Santa Clara, Cuba.

IVUniversidad de las Fuerzas Armadas, Dpto. Energía y Mecánica,, Extensión Latacunga, Ecuador.

 

 


RESUMEN

Los métodos de aprendizaje automatizado han sido usados con éxito en el cálculo de parámetros de diversos problemas de ingeniería, en que las variables involucradas tienen una relación no lineal entre sí y la modelación no permite representar el problema mediante una función matemática de fácil deducción. Para la estimación de las propiedades del suelo se involucran diversas variables, que hacen que su estimación por medio de modelos matemáticos sea un proceso complejo trasladando la solución del problema al campo de la inteligencia artificial. El presente trabajo tiene como objetivo desarrollar un modelo matemático para la estimación de la densidad del suelo a través del sensoramiento continuo utilizando un método de aprendizaje automatizado. La herramienta computacional de aprendizaje automatizado que se utilizó fue WEKA, mediante la cual se aplicaron tres métodos de predicción numérica (redes neuronales artificiales del tipo multicapa, K de los vecinos más cercanos y regresión lineal). La validación del modelo se realizó mediante la validación cruzada y experimental. Los resultados muestran que el mejor método es el K de los vecinos más cercanos con un error medio absoluto de 0,06 y un coeficiente de correlación de 0,89; las variables de mayor peso en la predicción fueron: el contenido de humedad seguido de la velocidad de trabajo, la fuerza, ancho de la herramienta de trabajo y la profundidad.

Palabras clave: densidad volumétrica, inteligencia artificial, compactación del suelo, estimación de la densidad del suelo.


ABSTRACT

The machine learning methods have been used successfully in the calculation of parameters of various problems of engineering, in which the complicated variables have a relation nonlinear among themselves and the modelation does not enable representing the intervening problem through a mathematical function of easy deduction. For the estimation of soil properties several variables are analyzed that make their estimation by means of mathematical models is a complex process transferring the problem solution to artificial intelligence field. The present work aims at developing a mathematical model for the estimation of soil density through the on-the-go soil sensing, a method of automatized learning. The computational learning automated tool used was WEKA, by means of which three procedures of automatized learning applied (multilayer perceptron neuronal artificial nets and K-nearest neighbor). The validation of the model came true by means of the crossed and experimental validation. Results evidence that the best method is the K-nearest neighbor with absolute mean error of 0.06 and a correlation coefficient of 0.89; variables of bigger weight in prediction were moisture content followed by work speed, power, width of the working tool and the depth.

Keywords: Bulk density, artificial intelligence, soil compaction, prediction of soil compaction


 

 

INTRODUCCIÓN

La densidad del suelo puede ser considerada como uno de los factores de mayor importancia que indican la compactación del suelo. La compactación del suelo, es la disminución de su volumen por la aplicación de una carga mecánica, esta causa cambios en el contenido de humedad y en la aireación del suelo, impidiendo el desarrollo radicular de las plantas (Gill y Vanden Berg, 1968; Soane y van Ouwerkerk, 1994; Mouazen y Ramon, 2006; RPACAPV, 2008; Herrera et al., 2011; Naderi-Boldaji et al., 2013; Quraishi y Mouazen, 2013), es determinada a través de la medición directa o indirecta de la densidad volumétrica o la resistencia a la penetración del suelo. La determinación cuantitativa de la compactación del suelo es necesaria para determinar su severidad e identificar el modo más adecuado de combatirla. Como alternativa, el incremento de la compactación puede ser detectado mediante el uso de mediciones indirectas de las tensiones del suelo (resistencia mecánica para penetrar objetos), o la reducción de espacios porosos interconectados (permeabilidad de fluidos).

Dada la importancia que tiene el conocimiento de la compactación del suelo como una de las variables de mayor significación a la hora de elaborar estrategias de manejo de los cultivos, se han desarrollado sensores para su medición continua y en sitio específico (Mouazen y Ramon, 2006; Herrera et al., 2011; Naderi-Boldaji et al., 2013; Quraishi y Mouazen, 2013). Como principio de funcionamiento emplean la medición de los esfuerzos del suelo, la permeabilidad de los fluidos, o el contenido de agua en el suelo (Adamchuk et al., 2008), los más aceptados son los que basan su principio de funcionamiento en la medición de la resistencia mecánica del suelo ya sea en todo el perfil del suelo o en una profundidad dada. Estas lecturas de la resistencia mecánica son utilizadas posteriormente para estimar la compactación del suelo.

A partir de esta problemática varios investigadores han desarrollado ecuaciones que le permiten correlacionar las lecturas del sensor con la magnitud de la compactación del suelo medida a partir de la resistencia a la penetración o de la densidad volumétrica, en las que incluyen tanto las variables de operación del sensor como las que caracterizan su estado físico, siendo un factor determinante las características del sensor y su principio de funcionamiento.

Los parámetros de operación que se tienen en cuenta durante el sensado de la compactación, son: la profundidad, el ancho del órgano de trabajo y la velocidad de trabajo. Las variables más utilizadas para caracterizar el estado físico del suelo son: humedad, textura y densidad del suelo, siendo el contenido de humedad la variable que mayor significación tiene en la exactitud de las predicciones (Andrade et al., 2001; Mouazen et al., 2003; Hall y Raper, 2005).

Con el avance de las técnicas informáticas, se han desarrollado métodos basados en el aprendizaje automatizado, los cuales han sido enfocados fundamentalmente al desarrollo de modelos para la estimación de diferentes variables (entre los que están Redes neuronales y K de los vecinos más cercanos).

El Aprendizaje Automatizado (AA) es una rama de la Inteligencia Artificial (IA) cuyo objetivo es desarrollar técnicas que permitan crear programas que puedan aprender de forma similar a lo realizado por los humanos, es decir, aprender por sí mismos. En fin, crear programas capaces de generalizar comportamientos a partir de una información no estructurada suministrada en forma de ejemplos. Es, por lo tanto, un proceso de inducción del conocimiento. En muchas ocasiones el campo de actuación del mismo se solapa con el de la estadística, ya que las dos disciplinas se basan en el análisis de datos. Sin embargo, el Aprendizaje Automatizado se centra más en el estudio de la complejidad computacional de los problemas (Bello, 2012).

Para el análisis previo de los datos se utilizan varios métodos como la selección de ejemplos (experimentos) y de atributos (variables), y la normalización de los atributos, permitiendo mejorar la calidad del modelo de aprendizaje. Sintetizando la descripción de los objetos, de manera tal que la información sea preservada de la forma más compacta y clara posible, favoreciendo la labor de aprendizaje, es decir, distingue los atributos realmente relevantes en la base de datos, sintetizando la información e incrementando la efectividad del proceso de aprendizaje.

Existen varios métodos de aprendizaje automatizado para el procesamiento de los datos entre los que se encuentran Redes neuronales del tipo multicapa (MLP) y K de los vecinos más cercanos (K- NN) para el desarrollo de modelos para la solución de diversos problemas y para su aplicación se pueden utilizar varias herramientas, entre ellas están Orange, Keel, Weka.

Tomando en cuenta esta problemática, el objetivo del trabajo es desarrollar un modelo matemático para la estimación de la densidad del suelo a través del sensoramiento continuo empleando un método de aprendizaje automatizado.

 

MÉTODOS

Métodos empleados para el desarrollo del modelo

Para el desarrollo del modelo se emplearon tres métodos de predicción numérica: redes neuronales del tipo multicapa (MLP), K de los vecinos más cercanos (K- NN).

Las redes neuronales del tipo multicapa, es un modelo computacional que pretende simular el funcionamiento del cerebro humano a partir del desarrollo de una arquitectura que toma rasgos del funcionamiento de este órgano, sin llegar a desarrollar una réplica del mismo (Burr, 1988). Son excelentes clasificadores, entrenados de forma discriminativa (Rynkiewicz, 2012), utilizando el aprendizaje con propagación hacia atrás de los errores BP (back propagation), este procedimiento pertenece a la categoría de supervisado, pues requiere conocer las salidas correctas para cada ejemplo de entrada. El procedimiento de aprendizaje con propagación del error hacia atrás es para redes con una capa de unidades de entrada, cualquier cantidad de capas intermedias y una capa de unidades de salida (Fig. 1), (Carpenter, 1989).

Los sistemas de vecinos más cercanos se basan en la suposición de que los ejemplos cercanos pertenecen a la misma clase. Su fase de aprendizaje es muy simple, pues se limita a almacenar los ejemplos del conjunto de entrenamiento. El clasificador busca los k ejemplos más cercanos al dato que se quiere clasificar y le asigna la clase más frecuente entre ellos. Son rápidos en el entrenamiento pero producen clasificadores no discriminatorios, lo que significa que el proceso de entrenamiento está basado en la maximización de la pertenencia de los datos a una clase, ignorando la información entre clases (Araúzo, 2006).

El k-NN constituye un algoritmo clásico de la forma de solución conocida a un problema similar y ha sido empleado en problemas de clasificación y regresión. El método básicamente consiste en comparar la nueva instancia a clasificar con los datos o ejemplos existentes del problema en cuestión, recuperando los k ejemplos más cercanos, lo cual depende del parecido entre los atributos del nuevo ejemplo con los ejemplos de la muestra de aprendizaje o entrenamiento. Como resultado del mismo se devuelve la clase mayoritaria de aquellos k ejemplos más cercanos a él.

Para la aplicación del método y su vez para el desarrollo del modelo la herramienta que se utilizó fue Weka, la cual constituye un entorno de trabajo que integra una amplia colección de algoritmos. Fue desarrollado en lenguaje Java por un equipo de investigadores de la universidad de Waikato (Nueva Zelanda) bajo licencia GNU (General Public License), y se caracteriza por la independencia de su arquitectura, ya que funciona en cualquier plataforma sobre la que haya una máquina virtual Java disponible. Permite aplicar, analizar y evaluar algunas de las técnicas más relevantes del análisis de datos, dentro de las que se enmarcan: el pre-procesamiento de datos, clasificación, regresión, agrupamiento, reglas de asociación y visualización, es un software libre. Está orientado a la extensibilidad, por lo que es posible añadir nuevas funcionalidades. Todo lo anterior justifica que sea una de las herramientas más utilizadas en la minería de datos (Witten y Frank, 2005).

Desarrollo de un modelo computacional para la estimación de la densidad del suelo

El desarrollo del modelo, contó de varias etapas, inicialmente se creó una base de datos en un editor de texto, donde se incluyeron mediciones de la fuerza de tiro horizontal (D) del suelo durante la experimentación en las condiciones controladas del canal de suelos del CEMA, además de experimentos realizados por otros investigadores en diferentes condiciones y tipos de suelo (Tabla 1). También se incluyeron las variables requeridas por los modelos para la estimación de la densidad del suelo, siendo: el contenido de humedad (MC); la fuerza (D); la velocidad de trabajo de la herramienta (V); el ancho de trabajo (W); la profundidad de trabajo (d); el contenido de arcilla (arcilla); el contenido de limo (limo); el contenido de arena (arena).

Posteriormente se realizó un pre procesamiento de la base de datos, consistente en normalizar la misma, con el objetivo de transformar el rango de valores a un intervalo determinado (normalmente [0;1]), para que todos los atributos (variables) estén en el mismo rango. Este procedimiento se realizó una vez importada la base de datos en la herramienta de aprendizaje automatizado Weka 3.7.5, mediante la ecuación (1).

(1)

Una vez normalizada la base de datos, se pasó a la búsqueda de los modelos para lo cual se recurrió al empleo de tres métodos de predicción numérica: regresión lineal (RL); redes neuronales del tipo multicapa (MLP); y K- vecinos más cercanos (K-NN) a través de la herramienta computacional seleccionada, se aplicó una técnica de división de los datos para la enseñanza – entrenamiento – validación, denominada validación cruzada (K-Fold Cross Validations) con K=10, para cada método.

Resultado de la aplicación de los métodos de predicción numérica

Redes neuronales del tipo multicapa. Se diseñó una red neuronal con ocho atributos de entrada (variables independientes) y una clase (variable dependiente), la misma posee una capa oculta con cuatro neuronas. Fue entrenada a partir de los datos normalizados empleando la metodología de aprendizaje propagación hacia atrás (backpropagation).

El entrenamiento de la red neuronal, permitió obtener un modelo para la predicción de la densidad del suelo. Los resultados de la validación cruzada de este modelo mostraron (Tabla 2), que existe correlación entre las variables predichas y observadas (r=0,75), con una raíz del error cuadrático medio de 0,16 g·cm-3. Y un error medio absoluto de un 13%.

K- Vecinos más Cercanos. Este método se empleó para la búsqueda de un modelo que permita la estimación de la densidad del suelo. Con este se determina los K ejemplos más cercanos al problema (K=1).

Los resultados de la aplicación de este método mostraron (Tabla 2), que existe correlación entre los resultados predichos y observados (r=0,89), el error cuadrático medio es de 0,11 g·cm-3.

Validación experimental del modelo

Para la validación del modelo desarrollado por el método de los K vecinos más cercanos se realizaron 10 experimentos en el canal de suelos, se determinó la fuerza de tiro horizontal, para un amplio rango de condiciones de humedad y densidad (Tabla 3).

A partir de los resultados experimentales (Tabla 3), y resolviendo el modelo obtenido, se predijeron los valores de la densidad del suelo, a emplear en la validación del modelo. Una vez obtenidos los valores predichos los errores se determinaron mediante los estadígrafos: error cuadrático medio (ecuación 2), error cuadrático medio estandarizado (ecuación 3), error medio absoluto (ecuación 4), error absoluto relativo (ecuación 5), error cuadrático medio y el coeficiente de correlación (ecuación 6).

Error cuadrático medio

(2)

donde: Vobs, valores observados;

Vpred, valores predichos;

n, número de muestra.

Error cuadrático medio estandarizado

(3)

Error medio absoluto

(4)

Error absoluto relativo

(5)

Coeficiente de correlación

(6)

σVobs, desviación absoluta de los valores observados;

σpred, desviación absoluta de los valores predichos.

Los resultados de un análisis de correlación muestran (Tabla 4), que existe una alta correlación entre los valores observados y predichos r=0,957 (Figura 2). El error cuadrático medio estandarizado es de 0,0017 g·cm-3, lo cual es un indicador de que el modelo desarrollado es válido para la estimación de la densidad del suelo en los límites analizados.

 

CONCLUSIONES

 

NOTA

La mención de marcas comerciales de equipos, instrumentos o materiales específicos obedece a propósitos de identificación, no existiendo ningún compromiso promocional con relación a los mismos, ni por los autores ni por el editor.

 

REFERENCIAS BIBLIOGRÁFICAS

ADAMCHUK, V.I.; HEMMAT, A.; MOUAZEN, A.M.: “Soil Compaction Sensor Systems - Current Developments”, [en línea], En: ASAE Annual Meeting, Ed. American Society of Agricultural and Biological Engineers (ASABE), Providence, Rhode Island, p. 10, 2008, DOI: 10.13031/2013.24814, Disponible en: http://elibrary.asabe.org/abstract.asp?JID=5&AID=24814&CID=prov2008&T=1, [Consulta: 30 de enero de 2017].

ANDRADE, P.; ROSA, U.; UPADHYAYA, S.; JENKINS, B.; AGUERA, J.; JOSIAH, M.: “Soil profile force measurements using an instrumented tine”, [en línea], En: ASAE Annual Meeting, Ed. American Society of Agricultural and Biological Engineers (ASABE), St. Joseph, Michigan, p. 11, 2001, DOI: 10.13031/2013.15697, Disponible en: http://elibrary.asabe.org/abstract.asp?JID=5&AID=15697&CID=sca2001&T=1, [Consulta: 30 de enero de 2017].

ARAÚZO, A.: Un sistema inteligente para selección de características en clasificación, Universidad de Granada, Tesis de Doctorado, España, 238 p., 2006.

BELLO, M.: Un método de aproximación de funciones basado en el enfoque de los prototipos más cercanos utilizando relaciones de similaridad, Universidad Central “Marta Abreu” de Las Villas, Tesis de Grado, Santa Clara, Cuba, 94 p., 2012.

BURR, D.J.: “Experiments on neural net recognition of spoken and written text”, IEEE Transactions on Acoustics, Speech, and Signal Processing, 36(7): 1162-1168, 1988, ISSN: 0096-3518, DOI: 10.1109/29.1643, Disponible en: http://ieeexplore.ieee.org/document/1643/, [Consulta: 30 de enero de 2017].

CARPENTER, G.A.: “Neural network models for pattern recognition and associative memory”, Neural Networks, 2(4): 243-257, 1989, ISSN: 0893-6080, DOI: 10.1016/0893-6080(89)90035-X, Disponible en: http://www.sciencedirect.com/science/article/pii/089360808990035X, [Consulta: 30 de enero de 2017].

GILL, W.R.; VANDEN BERG, G.E.: Soil dynamics in tillage and traction, Ed. United States Department of Agriculture, Washington, D.C., 511 p., 1968.

HALL, H.E.; RAPER, R.L.: “Development and concept evaluation of an on-the-go soil strength measurement system”, Transactions of the ASAE, 48(2): 469-477, 2005, ISSN: 2151-0059, DOI: 10.13031/2013.18311, Disponible en: http://elibrary.asabe.org/abstract.asp??JID=3&AID=18311&CID=t2005&v=48&i=2&T=1, [Consulta: 30 de enero de 2017].

HERRERA, S.M.; IGLESIAS, C.C.; LARA, C.D.; GONZÁLEZ, C.O.; LÓPEZ, B.E.: “Desarrollo de un sensor para la medición continúa de la compactación del suelo”, Revista Ciencias Técnicas Agropecuarias, 20(1): 06-11, 2011, ISSN: 2071-0054, Disponible en: http://scielo.sld.cu/scielo.php?script=sci_abstract&pid=S2071-00542011000100001&lng=es&nrm=iso&tlng=es, [Consulta: 30 de enero de 2017].

MOUAZEN, A.M.; RAMON, H.: “Development of on-line measurement system of bulk density based on on-line measured draught, depth and soil moisture content”, Soil and Tillage Research, 86(2): 218-229, 2006, ISSN: 0167-1987, DOI: 10.1016/j.still.2005.02.026, Disponible en: http://www.sciencedirect.com/science/article/pii/S0167198705000711, [Consulta: 30 de enero de 2017].

MOUAZEN, A.M.; RAMON, H.; BAERDEMAEKER, J.D.: “Modelling Compaction from On-line Measurement of Soil Properties and Sensor Draught”, Precision Agriculture, 4(2): 203-212, 2003, ISSN: 1385-2256, 1573-1618, DOI: 10.1023/A:1024513523618, Disponible en: https://link.springer.com/article/10.1023/A:1024513523618, [Consulta: 30 de enero de 2017].

NADERI-BOLDAJI, M.; SHARIFI, A.; ALIMARDANI, R.; HEMMAT, A.; KEYHANI, A.; LOONSTRA, E.H.; WEISSKOPF, P.; STETTLER, M.; KELLER, T.: “Use of a triple-sensor fusion system for on-the-go measurement of soil compaction”, Soil and Tillage Research, 128: 44-53, 2013, ISSN: 0167-1987, DOI: 10.1016/j.still.2012.10.002, Disponible en: http://www.sciencedirect.com/science/article/pii/S016719871200222X, [Consulta: 30 de enero de 2017].

QURAISHI, M.Z.; MOUAZEN, A.M.: “Calibration of an on-line sensor for measurement of topsoil bulk density in all soil textures”, Soil and Tillage Research, 126: 219-228, 2013, ISSN: 0167-1987, DOI: 10.1016/j.still.2012.08.005, Disponible en: http://www.sciencedirect.com/science/article/pii/S0167198712001821, [Consulta: 30 de enero de 2017].

RPACAPV: “Compactación del suelo”, [en línea], 26 de mayo de 2008, Disponible en: http://www.euskadi.net/r33-2288/es/contenidos/informacion/suelo/es_1044/compactacion.html, [Consulta: 14 de octubre de 2017].

RYNKIEWICZ, J.: “General bound of overfitting for MLP regression models”, Neurocomputing, ser. Advances in artificial neural networks, machine learning, and computational intelligence (ESANN 2011), 90: 106-110, 2012, ISSN: 0925-2312, DOI: 10.1016/j.neucom.2011.11.028, Disponible en: http://www.sciencedirect.com/science/article/pii/S0925231212001865, [Consulta: 30 de enero de 2017].

SOANE, B.D.; VAN OUWERKERK, C.: Soil Compaction in Crop Production, [en línea], Ed. Elsevier, 695 p., Google-Books-ID: DP3KBAAAQBAJ, 1994, ISBN: 978-0-08-093400-6, Disponible en: https://books.google.com.cu/books?id=DP3KBAAAQBAJ, [Consulta: 30 de enero de 2017].

WITTEN, I.H.; FRANK, E.: Data Mining: Practical Machine Learning Tools and Techniques, [en línea], Ed. Morgan Kaufmann, 2.a ed., Amsterdam - Boston, MA, 560 p., 2005, ISBN: 978-0-12-088407-0, Disponible en: https://www.amazon.es/Data-Mining-Practical-Techniques-Management/dp/0120884070, [Consulta: 30 de enero de 2017].

 

 

Recibido: 14/06/2017

Aceptado: 22/12/2017

 

 

Darina Lara Coba, Prof. Auxiliar, Universidad Tecnológica de la Habana José Antonio Echeverría, Facultad de Ingeniería Mecánica, Departamento de Mecánica Aplicada, Marianao, La Habana, Cuba. E-mail: dlarac@mecanica.cujae.edu.cu