Revista Ciencias Técnicas Agropecuarias Vol. 32, No. 2, April-June, 2023, ISSN: 2071-0054
Código QR
CU-ID: https://cu-id.com/2177/v32n2e08
REVIEW

Method for Query Processing in a Geographic Information System

 

iDIvett Sosa-FrancoIUniversidad Agraria de La Habana, Facultad de Ciencias Técnicas, San José de las Laja, Mayabeque, Cuba.*✉:ivett@unah.edu.cu

iDGabriel Pérez-GuerraIUniversidad Agraria de La Habana, Facultad de Ciencias Técnicas, San José de las Laja, Mayabeque, Cuba.

iDNeili Machado-GarcíaIUniversidad Agraria de La Habana, Facultad de Ciencias Técnicas, San José de las Laja, Mayabeque, Cuba.

iDMaría Elena-Ruiz PérezIUniversidad Agraria de La Habana, Facultad de Ciencias Técnicas, San José de las Laja, Mayabeque, Cuba.


IUniversidad Agraria de La Habana, Facultad de Ciencias Técnicas, San José de las Laja, Mayabeque, Cuba.

 

*Author for correspondence: Ivett Sosa-Franco, e-mail: ivett@unah.edu.cu

ABSTRACT

Much geospatial information is stored in relational databases. Relational databases provide a reliable method for managing large amounts of data while offering a combination of system performance and ease of implementation. Users interacting with these systems perform queries to them with the primary objective of retrieving information. These queries are nothing more than natural language questions about the world and how people relate to it. This article discusses the main topics related to Geographic Information Systems and their most popular tools worldwide. Relevant aspects about Database Management Systems are also explained and a comparison between Relational and NoSQL is established. In addition, the main types of queries are discussed, as well as the language in which they are made and some examples of them are shown.

Keywords: 
Geographic Information Systems, Database Management Systems, queries

Received: 15/8/2022; Accepted: 13/3/2023

Ivett Sosa-Franco, MSc., Profesora, Universidad Agraria de La Habana “Fructuoso Rodríguez Pérez”. Carretera Tapaste y Autopista Nacional km 23 1/2, San José de Las Lajas, Mayabeque, Cuba. CP 32700, e-mail: ivett@unah.edu.cu ORCID iD: https://orcid.org/0000-0002-1286-8240

Gabriel Alberto Pérez-Guerra, MSc., Profesor, Universidad Agraria de La Habana “Fructuoso Rodríguez Pérez”. Carretera Tapaste y Autopista Nacional km 23 1/2, San José de Las Lajas, Mayabeque, Cuba. CP 32700, e-mail: gabrielpg@unah.edu.cu ORCID iD: https://orcid.org/0000-0001-6438-3627

Neili Machado-García, Dr.C., Profesora Titular, Universidad Agraria de La Habana “Fructuoso Rodríguez Pérez”. Carretera Tapaste y Autopista Nacional km 23 1/2, San José de Las Lajas, Mayabeque, Cuba. CP 32700, e-mail: neili@unah.edu.cu ORCID iD: https://orcid.org/0000-0001-6294-6481

María Elena Ruiz-Pérez, Dr.C., Profesora Titular, Universidad Agraria de La Habana “Fructuoso Rodríguez Pérez”. Carretera Tapaste y Autopista Nacional km 23 1/2, San José de Las Lajas, Mayabeque, Cuba. CP 32700,e-mail: mruiz@unah.edu.cu ORCID iD: https://orcid.org/0000-0001-6056-2601

The authors of this work declare no conflict of interests.

The mention of trademarks of specific equipment, instruments or materials is for identification purposes, there being no promotional commitment in relation to them, neither by the authors nor by the publisher

CONTENT

INTRODUCTION

 

Maps and cartographic technology are practically everywhere. Although the ways and means of making and distributing maps have been revolutionized with recent computer and technological advances (Bartel, 2022BARTEL, C.: “Computer Art, Technology, and the Medium”, En: Being and Value in Technology, Ed. Springer, pp. 141-161, 2022.) The art and science of map making dates back centuries. This is because humans are inherently spatial organisms, and in order for them to live in the world, they must first relate to it in some way (Restrepo, 2015RESTREPO, J.C.G.: “La cartografía en el ambito de las tecnologias de la informacion y la comunicación (TIC)”, DIM: Didáctica, Innovación y Multimedia, (31): 1-18, 2015, ISSN: 1699-3748.).

Currently, there are tools and computer programs applied to geography that allow the visualization of geographic and alphanumeric data in an integrated manner. They also allow information to be managed in the form of layers of different formats and to develop spatial analyzes for specific ends (Mariani, 2012MARIANI, G.: “Los Sistemas de Información Geográfica (SIG) - Caja de herramientas para un Nuevo Urbanismo”, En: 14 de junio de 2012.).

DEVELOPMENT OF THE TOPIC

 

Geographic Information Systems: Concepts and Main Tools

 

An example of this is Geographic Information Systems (GIS). According to Goodchild & Kemp (1990)GOODCHILD, M.F.; KEMP, K.K.: NCGIA core curriculum: introduction to GIS, Ed. National Center for Geographic Information and Analysis, University of …, vol. 1, 1990. they are information systems made up of hardware, software and procedures to capture, manage, manipulate, analyze, model and represent georeferenced data, with the objective of solving management and planning problems.

GIS are powerful tools for collecting, storing and managing spatial data using maps. GIS methods and tools are widely used in engineering applications, especially in the design, planning and management of transportation/logistics systems, facility design, resource location specification and allocation (specifically for agricultural resources) and the determination of potential regions with high demand. Other areas that depend on the collection, analysis and visualization of spatial data are telecommunications, agriculture, mining, among others (Balaman, 2019BALAMAN, Ş.Y.: “Chapter 7 - Modeling and Optimization Approaches in Design and Management of Biomass-Based Production Chains”, [en línea], En: Balaman, Ş.Y. (ed.), Decision-Making for Biomass-Based Production Chains, Ed. Academic Press, pp. 185-236, 1 de enero de 2019, DOI: 10.1016/B978-0-12-814278-3.00007-8, ISBN: 978-0-12-814278-3, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780128142783000078, [Consulta: 20 de agosto de 2022].).

A GIS allows managing a large amount of data and information. From the relatively simple task of mapping the route a tractor must follow to transport freshly picked food from the field to the more complex task of determining the most efficient planting process, GIS is used in both the public and private sectors. Online and mobile maps, navigation and location-based services are also personalizing and democratizing GIS by bringing maps and cartography to the masses (Dastrup, 2020R. ADAM DASTRUP, M.A.: “1.4 The Future of GIS”, [en línea], En: Introduction to Geographic Information Systems, 2020, Disponible en:https://gist.pressbooks.com/chapter/1-4/, [Consulta: 29 de julio de 2022].).

Comparison between QGIS and ArcGIS

 

At present there are different GIS applications, both commercial and open source, used by a large number of users. ArcGIS and QGIS are two of these applications mostly used when talking about GIS (Maurya et al., 2015MAURYA, S.; OHRI, A.; MISHRA, S.: “Open Source GIS: A Review”, En: 9 de octubre de 2015.)

According to Khan & Mohiuddin (2018)KHAN, S.; MOHIUDDIN, K.: “Evaluating the parameters of ArcGIS and QGIS for GIS”, Int. J. Adv. Res. Sci. Eng, 7: 582-594, 2018. Applications QGIS is a fully competent and easily accessible GIS tool, it is an open source program, free unlike ArcGIS. QGIS can be introduced in different frameworks, for example, Windows, Mac OS X, Linux (Ubuntu) and Unix, while ArcGIS is only supported by Windows.

In their work Maurya et al. (2015)MAURYA, S.; OHRI, A.; MISHRA, S.: “Open Source GIS: A Review”, En: 9 de octubre de 2015. state that there are many open source GIS software available globally, but QGIS is the most popular among them. Likewise, they state that ArcGIS is the most notorious proprietary software in the field of GIS, which is why both GIS are compared on several occasions. ArcGIS has an excellent graphical user interface compared to any open source software. However, it is only supported by Windows operating systems, while QGIS can be introduced in different frameworks such as Linux. ArcGIS has well-accepted documentation, while QGIS has extensive and well-described documentation, with numerous helpful and easy-to-understand tutorials and introductory videos.

According to Flenniken et al. (2020)FLENNIKEN, J.M.; STUGLIK, S.; IANNONE, B.V.: “Quantum GIS (QGIS): An introduction to a free alternative to more costly GIS platforms: FOR359/FR428, 2/2020”, EDIS, 2020(2): 7-7, 2020., QGIS is an increasingly useful tool for visualization and spatial analysis, making it a viable alternative to other expensive software packages. QGIS is an open source software that benefits from the contributions of experts and users from around the world. The open source nature of QGIS, coupled with the increasing availability of free data from online sources, offers an opportunity for inexperienced users to learn and incorporate GIS technology into their investigations.

In his work, Benduch (2017)BENDUCH, P.: “Comparison of the results of spatial analyses performed in arcgis and qgis software”, Infrastruktura i Ekologia Terenów Wiejskich, 2017. suggests that QGIS could be an acceptable alternative to ArcGis proprietary software, in the GIS teaching process, taking into account the financial possibility of educational institutions and also the complexity of its functionalities.

After consulting several bibliographies and analyzing the opinions of different authors like Khan & Mohiuddin, (2018)KHAN, S.; MOHIUDDIN, K.: “Evaluating the parameters of ArcGIS and QGIS for GIS”, Int. J. Adv. Res. Sci. Eng, 7: 582-594, 2018. Applications; Maurya et al. (2015)MAURYA, S.; OHRI, A.; MISHRA, S.: “Open Source GIS: A Review”, En: 9 de octubre de 2015.; Flenniken et al. (2020)FLENNIKEN, J.M.; STUGLIK, S.; IANNONE, B.V.: “Quantum GIS (QGIS): An introduction to a free alternative to more costly GIS platforms: FOR359/FR428, 2/2020”, EDIS, 2020(2): 7-7, 2020. and Benduch (2017)BENDUCH, P.: “Comparison of the results of spatial analyses performed in arcgis and qgis software”, Infrastruktura i Ekologia Terenów Wiejskich, 2017., it can be stated that both, QGIS and ArcGIS, are high-quality GIS software, both are stable systems and good proposals when choosing a GIS. But while ArcGIS stands out in many ways and has the backing of a large company behind it, its high cost is a barrier for many users. The great advantage of QGIS is that it is an economic proposal since a license is not needed to be able to use all the tools that it offers. In addition, it is free open source software, so it is available to any user, with the same functionalities and features of a paid GIS.

Data Types in A GIS: Spatial and Attribute Data

 

QGIS like other GIS supports the visualization and analysis of geographic data (Khan & Mohiuddin, 2018KHAN, S.; MOHIUDDIN, K.: “Evaluating the parameters of ArcGIS and QGIS for GIS”, Int. J. Adv. Res. Sci. Eng, 7: 582-594, 2018. Applications). In addition, it offers multiple facilities, such as data capture, management and consultation. It allows users to visualize and understand the relationships between geographic data in the form of maps, reports and charts. The available basic data types define the typical data on a map. There are mainly two types of data: attribute data and spatial data (Lithmee, 2019LITHMEE: “What is the Difference Between Attribute Data and Spatial Data”, [en línea], En: Pediaa.Com, 3 de marzo de 2019, Disponible en:https://pediaa.com/what-is-the-difference-between-attribute-data-and-spatial-data/, [Consulta: 20 de agosto de 2022].).

Spatial Data

 

Spatial data describes geometric information, such as a feature's location in space or its position relative to other features. In addition, they are multidimensional and cover several different data, although correlated (Howari & Ghrefat, 2021HOWARI, F.M.; GHREFAT, H.: “Chapter 4 - Geographic information system: spatial data structures, models, and case studies”, [en línea], En: Mohamed, A.-M.O.; Paleologos, E.K. y Howari, F.M. (eds.), Pollution Assessment for Sustainable Practices in Applied Sciences and Engineering, Ed. Butterworth-Heinemann, pp. 165-198, 1 de enero de 2021, DOI: 10.1016/B978-0-12-809582-9.00004-9, ISBN: 978-0-12-809582-9, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780128095829000049, [Consulta: 21 de agosto de 2022].).

They comprise the relative geographic information about the Earth and its characteristics. A pair of latitude and longitude coordinates defines a specific location on Earth. These are of two types, depending on the storage technique: raster data and vector data (Janipella et al., 2019JANIPELLA, R.; GUPTA, V.; MOHARIR, R.V.: “Chapter 8 - Application of Geographic Information System in Energy Utilization”, [en línea], En: Kumar, S.; Kumar, R. y Pandey, A. (eds.), Current Developments in Biotechnology and Bioengineering, Ed. Elsevier, pp. 143-161, 1 de enero de 2019, DOI: 10.1016/B978-0-444-64083-3.00008-7, ISBN: 978-0-444-64083-3, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780444640833000087, [Consulta: 21 de agosto de 2022].):

  • Raster data is made up of grid cells identified by row and column. The entire geographic area is divided into groups of individual cells, which represent an image. Satellite images, photographs and scanned images are examples of raster data (Figure 1, right).

  • Vector data consists of points, polylines and polygons. Wells, houses, among others, are represented by points. Roads, rivers, and streams are represented by polylines. Towns and cities are represented by polygons (Figure 1, left).

FIGURE 1.  Vector data (left) and raster data (right). Source: (Dempsey, 2022DEMPSEY, C.: “Types of GIS Data Explored: Vector and Raster”, GIS Lounge, 1 de julio de 2022, Disponible en:https://www.gislounge.com/geodatabases-explored-vector-and-raster-data/, [Consulta: 21 de agosto de 2022].).

Attribute Data

 

Attribute data are descriptions or measurements of geographic features on a map. It refers to detailed data that are combined with geospatial data. Attribute data help to get the meaningful information from a card. Each feature has properties that can be described. For example, a building: it has a year of construction, the number of floors, among other characteristics or attributes. They can also be facts that are known but not visible, such as the year of construction. Furthermore, they can represent the lack of a characteristic (Lithmee, 2019LITHMEE: “What is the Difference Between Attribute Data and Spatial Data”, [en línea], En: Pediaa.Com, 3 de marzo de 2019, Disponible en:https://pediaa.com/what-is-the-difference-between-attribute-data-and-spatial-data/, [Consulta: 20 de agosto de 2022].).

These data comprise relevant information about spatial data. The query function works based on the attribute data, that is, it is attached to the geospatial data. The attribute data types are (Janipella et al., 2019JANIPELLA, R.; GUPTA, V.; MOHARIR, R.V.: “Chapter 8 - Application of Geographic Information System in Energy Utilization”, [en línea], En: Kumar, S.; Kumar, R. y Pandey, A. (eds.), Current Developments in Biotechnology and Bioengineering, Ed. Elsevier, pp. 143-161, 1 de enero de 2019, DOI: 10.1016/B978-0-444-64083-3.00008-7, ISBN: 978-0-444-64083-3, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780444640833000087, [Consulta: 21 de agosto de 2022].):

  • Nominal data: describe different types of data categories, such as land use types or soil types.

  • Ordinal data: differentiate the data by its classification relationship. For example, cities can be grouped into large, medium, and small based on population size.

  • Interval Data: Have known intervals between values, such as a temperature reading. For example, a temperature reading of 30°C is 10°C warmer than 20°C.

  • Proportion data: These are the same as interval data, except that proportion data are based on a significant value or absolute zero. Population densities are an example of ratio data, because a density of 0 is an absolute zero.

Databases are used for the storage and organization of geographic data. GIS uses, among other data sources, spatial databases which allow users to have access to updated information without having to physically have spatial files. If the users have access to the spatial database, they will have access to the spatial information stored in it. Databases allow minimizing the possibility of errors in the handling of information since they facilitate the elimination of redundancies and inconsistencies. In addition, they help to structure and organize the data in an efficient and functional way (Nur et al., 2018NUR, W.H.; KUMORO, Y.; SUSILOWATI, Y.: “GIS and Geodatabase Disaster Risk for Spatial Planning”, IOP Conference Series: Earth and Environmental Science, 118: 012046, febrero de 2018, ISSN: 1755-1315, DOI: 10.1088/1755-1315/118/1/012046.).

Databases

 

A database is a listing or collection of data, usually assembled in such a way that they can be accessed quickly. However, especially in today's world, a database can be as simple as an address book containing a list of names and addresses to something as sophisticated as an entire database of thousands of customer records (Maliakal, 2019MALIAKAL, G.: “Chapter Two - Database Management”, [en línea], En: Levin-Epstein, M. (ed.), Careers in Biomedical Engineering, Ed. Academic Press, pp. 19-36, 1 de enero de 2019, DOI: 10.1016/B978-0-12-814816-7.00002-9, ISBN: 978-0-12-814816-7, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780128148167000029, [Consulta: 22 de agosto de 2022].).

Databases are collections of related data organized so that the data can be easily accessed, managed and updated. They can be based on software or hardware, with a single purpose, to store data (Cai & Vasilakos, 2017CAI, H.; VASILAKOS, A.V.: “Chapter 12 - Web of Things Data Storage”, [en línea], En: Sheng, Q.Z.; Qin, Y.; Yao, L. y Benatallah, B. (eds.), Managing the Web of Things, Ed. Morgan Kaufmann, Boston, pp. 325-354, 1 de enero de 2017, DOI: 10.1016/B978-0-12-809764-9.00015-9, ISBN: 978-0-12-809764-9, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780128097649000159, [Consulta: 22 de agosto de 2022].).

Database Management System

 

A database management system (DBMS) is software designed to help maintain and use large collections of data and the need for and use of these systems is growing rapidly. Database management systems offer various functions in addition to file management; they enable concurrency, control security, maintain data integrity, provide backup and recovery, control redundancy, enable data independence and provide a non-procedural query language (Singh, 2015SINGH, S.: “DATABASE MANAGEMENT SYSTEM”, Journal of Management Research and Analysis, 2(1): 72-80, Company: IP Innovative Publication Pvt. Ltd.Distributor: IP Innovative Publication Pvt. Ltd.Institution: IP Innovative Publication Pvt. Ltd.Label: IP Innovative Publication Pvt. Ltd.number: 1publisher: Ip Innovative Publication Pvt. Ltd., 15 de abril de 2015, ISSN: 2394-2770.).

DBMS were designed to facilitate the storage and retrieval of large collections of data. They include functions of protection and security of them, maintenance of the coherence of the stored data and the availability of them for multiple users at the same time (Rawat & Purnama, 2021RAWAT, B.; PURNAMA, S.: “MySQL Database Management System (DBMS) On FTP Site LAPAN Bandung”, International Journal of Cyber and IT Service Management, 1(2): 173-179, 2021.).

Comparison between Relational and NoSQL Database Management Systems

 

There are several types of DBMS: relational, distributed, NoSQL, object-oriented and graph-oriented. This is due to the variety of the way of working that is required of them. Among the most used for working with QGIS are Relational Database Management Systems (SGBDR) such as PostgreSQL and NoSQL database management systems such as MongoDB (Nayak et al., 2013NAYAK, A.; PORIYA, A.; POOJARY, D.: “Type of NOSQL databases and its comparison with relational databases”, International Journal of Applied Information Systems, 5(4): 16-19, 2013.).

According to Guillot-Jiménez & García (2016)GUILLOT JIMÉNEZ, J.; GARCÍA, L.: “Bases de datos NoSQL para la gestión de datos geoespaciales”, En: 16 de marzo de 2016, DOI: 10.13140/RG.2.1.3803.0481., NoSQL database management systems are an excellent option for applications that require efficient management of semi-structured and unstructured data and high availability by end users. For the management of geospatial data, document-oriented and graph-oriented systems stand out over those that have a key/value data model and column-oriented systems. Although the broader domain in terms of geospatial data management continues to be in the hands of relational systems.

In their work, Guo & Onstein (2020)GUO, D.; ONSTEIN, E.: “State-of-the-art geospatial information processing in NoSQL databases”, ISPRS International Journal of Geo-Information, 9(5): 331, 2020. state that NoSQL databases such as MongoDB are very useful for geospatial data work, since they load quickly and have a good execution time, they also have good query performance and abundant geospatial functions and indexing methods. Depending on the application scenario, graph databases, key-value databases and wide-column databases also have their own advantages. In addition, the calculation of geometric surfaces and the processing of volumes are not handled in existing NoSQL databases.

According to Nasution (2021)NASUTION, M.: Relational Database Management Systems, 2 de marzo de 2021. a RDBMS is a software used to store, manage, consult and retrieve the data stored in a relational database. It provides an interface between users and applications and the database, as well as administrative functions to manage data storage, access and performance.

In his work Twumasi (2002)TWUMASI, B.O.: “Modelling spatial object behaviours in object-relational geodatabase”, En: Ed. Citeseer, 2002., states that one of the logically well-established database models is the relational model, which organizes data in tables. These tables are manipulated by a RDBMS. GIS have traditionally used relational databases for their data storage. Despite its limited ability to capture the behavior of objects, relational technology is mathematically well established in the field of databases.

According to Yue & Tan (2017)YUE, P.; TAN, Z.: “GIS Databases and NoSQL Databases”, En: Reference Module in Earth Systems and Environmental Sciences, journalAbbreviation: Reference Module in Earth Systems and Environmental Sciences, 31 de diciembre de 2017, DOI: 10.1016/B978-0-12-409548-9.09596-8, ISBN: 978-0-12-409548-9. DB MS, which are based on relational models of geographic data, have dominated the business market for a long time and play an important role in the modern information society. Relational models are based on algebra sets with rigorous mathematical foundations and formal analysis capabilities.

In his work Hammersley (2018)HAMMERSLEY, B.: “SQL vs NoSQL: A Spatial Benchmark for Selected NoSQL and Relational Database Management Systems”, 2018. believes that DBMS have been at the forefront in the field of GIS such as QGIS for many years. In his research, he states that after a scalable DBMS performance test comparing two DBMS with a document DBMS and a graphics DBMS, the results show that the DBMS are generally superior, in terms of union sentences, extraction of significant statistics, partial record updates and referential integrity.

After the analysis and consultation of different bibliographies such as Guillot-Jiménez & García (2016)GUILLOT JIMÉNEZ, J.; GARCÍA, L.: “Bases de datos NoSQL para la gestión de datos geoespaciales”, En: 16 de marzo de 2016, DOI: 10.13140/RG.2.1.3803.0481.; Guo & Onstein (2020)GUO, D.; ONSTEIN, E.: “State-of-the-art geospatial information processing in NoSQL databases”, ISPRS International Journal of Geo-Information, 9(5): 331, 2020.; Hammersley (2018)HAMMERSLEY, B.: “SQL vs NoSQL: A Spatial Benchmark for Selected NoSQL and Relational Database Management Systems”, 2018.; Twumasi (2002)TWUMASI, B.O.: “Modelling spatial object behaviours in object-relational geodatabase”, En: Ed. Citeseer, 2002. and Yue y Tan (2017)YUE, P.; TAN, Z.: “GIS Databases and NoSQL Databases”, En: Reference Module in Earth Systems and Environmental Sciences, journalAbbreviation: Reference Module in Earth Systems and Environmental Sciences, 31 de diciembre de 2017, DOI: 10.1016/B978-0-12-409548-9.09596-8, ISBN: 978-0-12-409548-9., it can be stated that both, DBMS and NoSQL, are recommended databases to use when starting GIS projects, each with its advantages and disadvantages. However, DBMS provide greater support and a greater variety of tools because they have been on the market for longer. Relational systems are considered the most popular among organizations around the world as they provide a reliable method of storing and retrieving large amounts of data while offering a combination of system performance and ease of implementation. In addition, they are useful for handling and obtaining geographic data.

Postgresql

 

There are RDBMS with private and commercial licenses, among these are Microsoft SQL Server, Oracle and DB2, whose significant cost is in some cases only achievable by large organizations. However, free, open source software can also be found as powerful and effective as paid ones (Garrido et al., 2021PILICITA GARRIDO, A.; BORJA LÓPEZ, Y.; GUTIÉRREZ CONSTANTE, G.: “Rendimiento de MariaDB y PostgreSQL”, 2021.).

According to Ismail-Hossain et al. (2019)ISMAIL HOSSAIN, M.; MAHMUD, S.; SANTA, T.D.: “Oracle, MySQL, PostgreSQL, SQLite, SQL Server: Performance based competitive analysis”, 2019. and Wodyk & Skublewska-Paszkowska (2020WODYK, R.; SKUBLEWSKA-PASZKOWSKA, M.: “Performance comparison of relational databases SQL Server, MySQL and PostgreSQL using a web application and the Laravel framework”, Journal of Computer Sciences Institute, 17: 358-364, 2020.) among the most popular open source DBMS on the market worldwide are SQLite, MySQL and PostgreSQL. Each have their own unique characteristics and limitations and they excel in particular scenarios. SQLite excels in small applications while PostgreSQL excels thanks to features like parallel processing and concurrency. In addition, it guarantees the reliability and integrity of the data and is ideal for scientific and research projects.

PostgreSQL has a rich set of data types, allowing its extension by user-defined and scriptable types and operators. Its administration is based on users and privileges and it is highly reliable in terms of stability. The error messages can be in Spanish and make correct orders with accented words or with the letter 'ñ'. It can be extended with external libraries to support encryption, phonetic similarity searches, among others. It enables multi-version concurrency control, which significantly improves blocking and transaction operations in multi-user systems and it is possible to define a new type of table from another previously defined (Ginestà & Mora, 2012GINESTÀ, M.G.; MORA, O.P.: “Bases de datos en PostgreSQL”, Sl]:[sn], 2012.).

Spatial Databases

 

PostgreSQL, like other DBMS, by itself does not allow the storage of the physical location and the shape of the geometric objects within the tables, for this a spatial database is needed (Hess, 2022HESS, P.T.: Building a Spatial Database for Agricultural Record Keeping and Management on a Regenerative Farm, University of Southern California, 2022.).

Spatial databases allow the representation of simple geometric objects such as points, lines and polygons. Some handle complex structures such as 3D objects, topological coverages and linear and triangulated irregular networks. Such databases require additional functionality to process spatial data types efficiently and developers have often added geometric or feature data types (Salleh et al., 2021SALLEH, S.; UJANG, U.; AZRI, S.: “3D TOPOLOGICAL SUPPORT IN SPATIAL DATABASES: AN OVERVIEW.”, International Archives of the Photogrammetry, Remote Sensing & Spatial Information Sciences, 46, 2021.).

Spatial databases are extensions of classical databases that contain special objects, procedures and mechanisms to store and manipulate geospatial data (Maina et al., 2019MAINA, J.; OUMA, P.O.; MACHARIA, P.M.; ALEGANA, V.A.; MITTO, B.; FALL, I.S.; NOOR, A.M.; SNOW, R.W.; OKIRO, E.A.: “A spatial database of health facilities managed by the public health sector in sub Saharan Africa”, Scientific data, 6(1): 1-8, 2019.).

PostGIS extension of PostgreSQL

 

PostGIS is the extension for PostgreSQL DBMS, it stores the spatial object in the standard Well Known Binary (WKB) format. It automatically inherits the characteristics of business databases, as well as the open standards that a GIS implements within the database engine (Belciu et al., 2014BELCIU, A.; DIACONITA, V.; LUNGU, I.; VIRGOLICI, A.-M.: “Development of Spatial Database for Regional Development in Romania”, Informatica Economica, 18(3): 55, 2014.).

Among the main data used by PostGIS are point, linestring, polygon, multipoint, multilinestring and multipolygon (Leslie & Ramsey, 2022LESLIE, M.; RAMSEY, P.: “Introduction to PostGIS”, 2022.). This offers the ability to bulk load data from shape files1Formato de archivos de ESRI que almacena datos geoespaciales.. It is released under the GNU GPL license, which means it is available as open source software (Hsu & Obe, 2021HSU, L.S.; OBE, R.: PostGIS in action, Ed. Simon and Schuster, 2021, ISBN: 1-61729-669-4.).

SQL Queries

 

PostgreSQL like other DBMS allows users to enter queries to retrieve or manipulate the data needed for specific job functions. The main purpose of a query is to retrieve information, this function allows users to access the information or change the data in some way, such as adding or deleting information (Baik et al., 2019BAIK, C.; JAGADISH, H.V.; LI, Y.: “Bridging the semantic gap with SQL query logs in natural language interfaces to databases”, En: 2019 IEEE 35th International Conference on Data Engineering (ICDE), Ed. IEEE, pp. 374-385, 2019, ISBN: 1-5386-7474-2.)

The recovery process is carried out through queries where the structured information is stored, using an appropriate query language. It is necessary to take into account the key elements that allow the search, determining a greater degree of relevance and precision, such as indices, keywords and problems that may occur in the process (Kul et al., 2018KUL, G.; LUONG, D.T.A.; XIE, T.; CHANDOLA, V.; KENNEDY, O.; UPADHYAYA, S.: “Similarity metrics for SQL query clustering”, IEEE Transactions on Knowledge and Data Engineering, 30(12): 2408-2420, 2018.).

Queries have other important functions, including filtering data, presenting results clearly, compiling information and adding criteria (Uma et al., 2019UMA, M.; SNEHA, V.; SNEHA, G.; BHUVANA, J.; BHARATHI, B.: “Formation of SQL from natural language query using NLP”, En: 2019 International Conference on Computational Intelligence in Data Science (ICCIDS), Ed. IEEE, pp. 1-5, 2019, ISBN: 1-5386-9471-9.).

SQL, Structured Query Language

 

PostgreSQL uses the Structured Query Language (SQL) as the programming language to perform queries. (Shin et al., 2018SHIN, M.E.; CAMPBELL, J.; BURKHART, N.: Essentials of Geographic Information Systems, Ed. FlatWorld, 2018, ISBN: 1-4533-9080-4.). When the statements provided by SQL are used efficiently, it allows the creation of highly scalable, flexible and manageable systems (Pino et al., 2018PINO, A.V.; PONCE, J.; MORETA, O.E.: “Análisis de la optimización de sentencias SQL del Lenguaje de Consulta Estructurado usando grandes volúmenes de datos”, Revista Publicando, 5(16 (1)): 70-79, 2018.).

SQL implements clauses to structure queries. A clause is a language element that includes the query statements select, from, where, order by and having (Pratt, 2009PRATT, M.: “Asking the Right Questions”, 2009.).

  • Select indicates which fields of the attribute table the user wants to see.

  • From denotes the attribute table in which the information resides.

  • Where denotes user-defined criteria for attribute information that must be met in order to be included in the output set.

  • Order by denotes the sequence in which the output set will be displayed.

  • Having indicates the predicate used to filter the output of the order by clause.

While the select and from clauses are required statements in an SQL query, where is an optional clause used to limit the result set. Order by and having are optional clauses used to present information in an interpretable way (Shin et al., 2018SHIN, M.E.; CAMPBELL, J.; BURKHART, N.: Essentials of Geographic Information Systems, Ed. FlatWorld, 2018, ISBN: 1-4533-9080-4.).

TABLE 1.  Examples of SQL queries.
SQL Queries Natural Language Questions
Select * from crops order by crop.area Show the crops whose planted area is larger
Select * from crops where crop.production > 20 Crop whose production is greater than 20 t
Select * from crops where crops.name like ‘rice’ order by crops.production descending Show rice productions from highest to lowest

Source: self made

SQL queries correspond to questions made by users where the structure of SQL statements is similar to that of natural language (Taipalus et al., 2018TAIPALUS, T.; SIPONEN, M.; VARTIAINEN, T.: “Errors and complications in SQL query formulation”, ACM Transactions on Computing Education (TOCE), 18(3): 1-29, 2018.).

According to Shin et al. (2018)SHIN, M.E.; CAMPBELL, J.; BURKHART, N.: Essentials of Geographic Information Systems, Ed. FlatWorld, 2018, ISBN: 1-4533-9080-4. SQL queries are nothing more than natural language questions about the world and how people relate to it. These questions can be simple with a local focus or more complex with a more global perspective.

GIS Queries

 

The presence of a DBMS such as PostgreSQL within the GIS QGIS allows queries to be made to it; it is a call to said management system, which returns as a response a series of elements taken from the information contained in the database. In other words, of the total data, a part of the data is obtained as a result of the query. The answer to the query is a set of elements, in the same way that if a printed map asks what is here? and the data corresponding to the point that was indicated is obtained as a response. These data are a particular fraction of the set of all the contents on said map (Olaya, 2014OLAYA, V.: Sistemas de información geográfica. Un libro libre de Víctor Olaya, Ed. Obtenido de: http://volaya.github.io/librosig/chapters …, 2014.).

One of the analyzes that can be performed on a geographic information layer within QGIS is its query. A query is understood as an operation in which the geographic data is asked some kind of simple question, generally based on simple formal concepts. This type of analysis, although it does not imply the use of complex analytical concepts, is one of the key elements of GIS, since it is a basic part of their daily use (Pratt, 2009PRATT, M.: “Asking the Right Questions”, 2009.)

Types of Queries in GIS

 

After analyzing several bibliographies, it was found that Olaya (2014)OLAYA, V.: Sistemas de información geográfica. Un libro libre de Víctor Olaya, Ed. Obtenido de: http://volaya.github.io/librosig/chapters …, 2014.; Shin et al. (2018)SHIN, M.E.; CAMPBELL, J.; BURKHART, N.: Essentials of Geographic Information Systems, Ed. FlatWorld, 2018, ISBN: 1-4533-9080-4. and Pratt (2009)PRATT, M.: “Asking the Right Questions”, 2009. classify the types of queries in a GIS. Regardless of this, the authors refer to the same types of queries to classify them into three fundamental types: selection, attribute queries and spatial queries.

Selection

 

Selection represents the easiest way to find and query spatial data. The selection of functions highlights the attributes of interest, both on the screen and in the attribute table, for later visualization or analysis. To accomplish this, points, lines, and polygons are selected simply by using the cursor to "point and click" on the feature of interest or by using the cursor to drag a box around those features. Alternatively, features can be selected by using a graphical object, such as a circle, line or polygon, to highlight all features found within the object (Shin et al., 2018SHIN, M.E.; CAMPBELL, J.; BURKHART, N.: Essentials of Geographic Information Systems, Ed. FlatWorld, 2018, ISBN: 1-4533-9080-4.).

Advanced options for selecting subsets of data from the larger dataset include creating a new selection, selecting currently selected features, adding to the current selection and removing the current selection (Olaya, 2014OLAYA, V.: Sistemas de información geográfica. Un libro libre de Víctor Olaya, Ed. Obtenido de: http://volaya.github.io/librosig/chapters …, 2014.).

Query by Attribute

 

The attribute query requires the treatment of the attribute data. In other words, it is a process of selecting information through the formulation of logical questions. Attribute queries effectively take the form of a question. The easiest way to conceptualize it is that you are constructing a sentence using a special syntax that will select a subset of your data as a result (Shnizai, 2011SHNIZAI, Z.: Spatial and Attribute Querying, 12 de noviembre de 2011.).

Map features and their associated data can be retrieved through querying for attribute information within data tables. For example, the search and query tools allow a user to display all productive plots whose area is greater than 5 ha, to display the plots planted with rice with the highest yield, among others (Shin et al., 2018SHIN, M.E.; CAMPBELL, J.; BURKHART, N.: Essentials of Geographic Information Systems, Ed. FlatWorld, 2018, ISBN: 1-4533-9080-4.).

Attributes can be numeric values, text strings, bool values (that is, true or false) or dates. This type of query is similar to a query made to any database; however, the responses, that is, the characteristics related to the records selected by the process are highlighted on the map, as well as in the table (Pratt, 2009PRATT, M.: “Asking the Right Questions”, 2009.).

Spatial Query

 

Spatial queries are queries in a spatial database that can be answered solely from the geometric information, that is, the spatial position and extent of the objects involved. Also known as "geography queries", they allow highlighting particular attributes by examining their position in relation to other features (Shin et al., 2018SHIN, M.E.; CAMPBELL, J.; BURKHART, N.: Essentials of Geographic Information Systems, Ed. FlatWorld, 2018, ISBN: 1-4533-9080-4.).

Spatial query functions allow finding display and/or isolate attribute records connected to map features located within a defined area of interest. Spatial query involves the selection of features based on location or spatial relationships, which requires processing of spatial information. Spatial queries are a useful tool with the ability to find how or where two or more data sets are spatially related. (Shnizai, 2011SHNIZAI, Z.: Spatial and Attribute Querying, 12 de noviembre de 2011.).

Spatial Relations

 

The spatial relationship is the central component of a spatial query. It is a relationship between spatial features with respect to their spatial locations and spatial arrangements. There are three types of spatial relationships in GIS: proximity relationships, topological relationships and direction relationships (Dan et al., 2020DAN, S.; KORDJAMSHIDI, P.; BONN, J.; BHATIA, A.; CAI, J.; PALMER, M.; ROTH, D.: “From spatial relations to spatial configurations”, arXiv preprint arXiv:2007.09557, 2020.).

  • Topological relationships are not affected by bicontinuous transformations, such as stretching, shifting, rotating or bending the spatial features involved.

  • Proximity relationships refer to spatial relationships based on distances between entities.

  • Direction relationships are based on the angular separation of a feature in relation to another feature in a coordinate system.

Queries can be made on the attribute component of the data, on the spatial component or on both. In any case, they are linked, so the result of the query affects both. The selection is evident on both components, regardless of which of them has been in charge of applying the selection criteria. Both, the attribute table and the visual representation of the spatial component, are affected by performing a query.

CONCLUSIONS

 

GIS are powerful tools for collecting, storing and managing spatial data. In addition, there are open source GIS tools that are very popular worldwide due to their easy access and competitiveness, among them is QGIS. It uses relational databases to store and manage geographic data. DBMS such as PostgreSQL allow minimizing the possibility of errors in information handling since they facilitate the elimination of redundancies and inconsistencies. QGIS together with PostgreSQL through the PostGIS extension to work with spatial databases constitutes a powerful tool when processing georeferenced data. Likewise, it was possible to conclude that to retrieve or manipulate information people must consult this database system. This is nothing more than natural language questions written by users working with QGIS. These questions are made in SQL language and are classified into three main types: selection, attribute and spatial queries. Any of the three will give true results, no matter if they are used separately or in combination.

NOTE

 
1

Formato de archivos de ESRI que almacena datos geoespaciales.

REFERENCES

 

BAIK, C.; JAGADISH, H.V.; LI, Y.: “Bridging the semantic gap with SQL query logs in natural language interfaces to databases”, En: 2019 IEEE 35th International Conference on Data Engineering (ICDE), Ed. IEEE, pp. 374-385, 2019, ISBN: 1-5386-7474-2.

BALAMAN, Ş.Y.: “Chapter 7 - Modeling and Optimization Approaches in Design and Management of Biomass-Based Production Chains”, [en línea], En: Balaman, Ş.Y. (ed.), Decision-Making for Biomass-Based Production Chains, Ed. Academic Press, pp. 185-236, 1 de enero de 2019, DOI: 10.1016/B978-0-12-814278-3.00007-8, ISBN: 978-0-12-814278-3, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780128142783000078, [Consulta: 20 de agosto de 2022].

BARTEL, C.: “Computer Art, Technology, and the Medium”, En: Being and Value in Technology, Ed. Springer, pp. 141-161, 2022.

BELCIU, A.; DIACONITA, V.; LUNGU, I.; VIRGOLICI, A.-M.: “Development of Spatial Database for Regional Development in Romania”, Informatica Economica, 18(3): 55, 2014.

BENDUCH, P.: “Comparison of the results of spatial analyses performed in arcgis and qgis software”, Infrastruktura i Ekologia Terenów Wiejskich, 2017.

CAI, H.; VASILAKOS, A.V.: “Chapter 12 - Web of Things Data Storage”, [en línea], En: Sheng, Q.Z.; Qin, Y.; Yao, L. y Benatallah, B. (eds.), Managing the Web of Things, Ed. Morgan Kaufmann, Boston, pp. 325-354, 1 de enero de 2017, DOI: 10.1016/B978-0-12-809764-9.00015-9, ISBN: 978-0-12-809764-9, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780128097649000159, [Consulta: 22 de agosto de 2022].

DAN, S.; KORDJAMSHIDI, P.; BONN, J.; BHATIA, A.; CAI, J.; PALMER, M.; ROTH, D.: “From spatial relations to spatial configurations”, arXiv preprint arXiv:2007.09557, 2020.

DEMPSEY, C.: “Types of GIS Data Explored: Vector and Raster”, GIS Lounge, 1 de julio de 2022, Disponible en:https://www.gislounge.com/geodatabases-explored-vector-and-raster-data/, [Consulta: 21 de agosto de 2022].

FLENNIKEN, J.M.; STUGLIK, S.; IANNONE, B.V.: “Quantum GIS (QGIS): An introduction to a free alternative to more costly GIS platforms: FOR359/FR428, 2/2020”, EDIS, 2020(2): 7-7, 2020.

GINESTÀ, M.G.; MORA, O.P.: “Bases de datos en PostgreSQL”, Sl]:[sn], 2012.

GOODCHILD, M.F.; KEMP, K.K.: NCGIA core curriculum: introduction to GIS, Ed. National Center for Geographic Information and Analysis, University of …, vol. 1, 1990.

GUILLOT JIMÉNEZ, J.; GARCÍA, L.: “Bases de datos NoSQL para la gestión de datos geoespaciales”, En: 16 de marzo de 2016, DOI: 10.13140/RG.2.1.3803.0481.

GUO, D.; ONSTEIN, E.: “State-of-the-art geospatial information processing in NoSQL databases”, ISPRS International Journal of Geo-Information, 9(5): 331, 2020.

HAMMERSLEY, B.: “SQL vs NoSQL: A Spatial Benchmark for Selected NoSQL and Relational Database Management Systems”, 2018.

HESS, P.T.: Building a Spatial Database for Agricultural Record Keeping and Management on a Regenerative Farm, University of Southern California, 2022.

HOWARI, F.M.; GHREFAT, H.: “Chapter 4 - Geographic information system: spatial data structures, models, and case studies”, [en línea], En: Mohamed, A.-M.O.; Paleologos, E.K. y Howari, F.M. (eds.), Pollution Assessment for Sustainable Practices in Applied Sciences and Engineering, Ed. Butterworth-Heinemann, pp. 165-198, 1 de enero de 2021, DOI: 10.1016/B978-0-12-809582-9.00004-9, ISBN: 978-0-12-809582-9, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780128095829000049, [Consulta: 21 de agosto de 2022].

HSU, L.S.; OBE, R.: PostGIS in action, Ed. Simon and Schuster, 2021, ISBN: 1-61729-669-4.

ISMAIL HOSSAIN, M.; MAHMUD, S.; SANTA, T.D.: “Oracle, MySQL, PostgreSQL, SQLite, SQL Server: Performance based competitive analysis”, 2019.

JANIPELLA, R.; GUPTA, V.; MOHARIR, R.V.: “Chapter 8 - Application of Geographic Information System in Energy Utilization”, [en línea], En: Kumar, S.; Kumar, R. y Pandey, A. (eds.), Current Developments in Biotechnology and Bioengineering, Ed. Elsevier, pp. 143-161, 1 de enero de 2019, DOI: 10.1016/B978-0-444-64083-3.00008-7, ISBN: 978-0-444-64083-3, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780444640833000087, [Consulta: 21 de agosto de 2022].

KHAN, S.; MOHIUDDIN, K.: “Evaluating the parameters of ArcGIS and QGIS for GIS”, Int. J. Adv. Res. Sci. Eng, 7: 582-594, 2018. Applications

KUL, G.; LUONG, D.T.A.; XIE, T.; CHANDOLA, V.; KENNEDY, O.; UPADHYAYA, S.: “Similarity metrics for SQL query clustering”, IEEE Transactions on Knowledge and Data Engineering, 30(12): 2408-2420, 2018.

LESLIE, M.; RAMSEY, P.: “Introduction to PostGIS”, 2022.

LITHMEE: “What is the Difference Between Attribute Data and Spatial Data”, [en línea], En: Pediaa.Com, 3 de marzo de 2019, Disponible en:https://pediaa.com/what-is-the-difference-between-attribute-data-and-spatial-data/, [Consulta: 20 de agosto de 2022].

MAINA, J.; OUMA, P.O.; MACHARIA, P.M.; ALEGANA, V.A.; MITTO, B.; FALL, I.S.; NOOR, A.M.; SNOW, R.W.; OKIRO, E.A.: “A spatial database of health facilities managed by the public health sector in sub Saharan Africa”, Scientific data, 6(1): 1-8, 2019.

MALIAKAL, G.: “Chapter Two - Database Management”, [en línea], En: Levin-Epstein, M. (ed.), Careers in Biomedical Engineering, Ed. Academic Press, pp. 19-36, 1 de enero de 2019, DOI: 10.1016/B978-0-12-814816-7.00002-9, ISBN: 978-0-12-814816-7, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780128148167000029, [Consulta: 22 de agosto de 2022].

MARIANI, G.: “Los Sistemas de Información Geográfica (SIG) - Caja de herramientas para un Nuevo Urbanismo”, En: 14 de junio de 2012.

MAURYA, S.; OHRI, A.; MISHRA, S.: “Open Source GIS: A Review”, En: 9 de octubre de 2015.

NASUTION, M.: Relational Database Management Systems, 2 de marzo de 2021.

NAYAK, A.; PORIYA, A.; POOJARY, D.: “Type of NOSQL databases and its comparison with relational databases”, International Journal of Applied Information Systems, 5(4): 16-19, 2013.

NUR, W.H.; KUMORO, Y.; SUSILOWATI, Y.: “GIS and Geodatabase Disaster Risk for Spatial Planning”, IOP Conference Series: Earth and Environmental Science, 118: 012046, febrero de 2018, ISSN: 1755-1315, DOI: 10.1088/1755-1315/118/1/012046.

OLAYA, V.: Sistemas de información geográfica. Un libro libre de Víctor Olaya, Ed. Obtenido de: http://volaya.github.io/librosig/chapters …, 2014.

PILICITA GARRIDO, A.; BORJA LÓPEZ, Y.; GUTIÉRREZ CONSTANTE, G.: “Rendimiento de MariaDB y PostgreSQL”, 2021.

PINO, A.V.; PONCE, J.; MORETA, O.E.: “Análisis de la optimización de sentencias SQL del Lenguaje de Consulta Estructurado usando grandes volúmenes de datos”, Revista Publicando, 5(16 (1)): 70-79, 2018.

PRATT, M.: “Asking the Right Questions”, 2009.

R. ADAM DASTRUP, M.A.: “1.4 The Future of GIS”, [en línea], En: Introduction to Geographic Information Systems, 2020, Disponible en:https://gist.pressbooks.com/chapter/1-4/, [Consulta: 29 de julio de 2022].

RAWAT, B.; PURNAMA, S.: “MySQL Database Management System (DBMS) On FTP Site LAPAN Bandung”, International Journal of Cyber and IT Service Management, 1(2): 173-179, 2021.

RESTREPO, J.C.G.: “La cartografía en el ambito de las tecnologias de la informacion y la comunicación (TIC)”, DIM: Didáctica, Innovación y Multimedia, (31): 1-18, 2015, ISSN: 1699-3748.

SALLEH, S.; UJANG, U.; AZRI, S.: “3D TOPOLOGICAL SUPPORT IN SPATIAL DATABASES: AN OVERVIEW.”, International Archives of the Photogrammetry, Remote Sensing & Spatial Information Sciences, 46, 2021.

SHIN, M.E.; CAMPBELL, J.; BURKHART, N.: Essentials of Geographic Information Systems, Ed. FlatWorld, 2018, ISBN: 1-4533-9080-4.

SHNIZAI, Z.: Spatial and Attribute Querying, 12 de noviembre de 2011.

SINGH, S.: “DATABASE MANAGEMENT SYSTEM”, Journal of Management Research and Analysis, 2(1): 72-80, Company: IP Innovative Publication Pvt. Ltd.Distributor: IP Innovative Publication Pvt. Ltd.Institution: IP Innovative Publication Pvt. Ltd.Label: IP Innovative Publication Pvt. Ltd.number: 1publisher: Ip Innovative Publication Pvt. Ltd., 15 de abril de 2015, ISSN: 2394-2770.

TAIPALUS, T.; SIPONEN, M.; VARTIAINEN, T.: “Errors and complications in SQL query formulation”, ACM Transactions on Computing Education (TOCE), 18(3): 1-29, 2018.

TWUMASI, B.O.: “Modelling spatial object behaviours in object-relational geodatabase”, En: Ed. Citeseer, 2002.

UMA, M.; SNEHA, V.; SNEHA, G.; BHUVANA, J.; BHARATHI, B.: “Formation of SQL from natural language query using NLP”, En: 2019 International Conference on Computational Intelligence in Data Science (ICCIDS), Ed. IEEE, pp. 1-5, 2019, ISBN: 1-5386-9471-9.

WODYK, R.; SKUBLEWSKA-PASZKOWSKA, M.: “Performance comparison of relational databases SQL Server, MySQL and PostgreSQL using a web application and the Laravel framework”, Journal of Computer Sciences Institute, 17: 358-364, 2020.

YUE, P.; TAN, Z.: “GIS Databases and NoSQL Databases”, En: Reference Module in Earth Systems and Environmental Sciences, journalAbbreviation: Reference Module in Earth Systems and Environmental Sciences, 31 de diciembre de 2017, DOI: 10.1016/B978-0-12-409548-9.09596-8, ISBN: 978-0-12-409548-9.

Revista Ciencias Técnicas Agropecuarias Vol. 32, No. 2, April-June, 2023, ISSN: 2071-0054
 
REVISIÓN

Método para el procesamiento de consultas en un Sistema de Información Geográfica

 

iDIvett Sosa-FrancoIUniversidad Agraria de La Habana, Facultad de Ciencias Técnicas, San José de las Laja, Mayabeque, Cuba.*✉:ivett@unah.edu.cu

iDGabriel Pérez-GuerraIUniversidad Agraria de La Habana, Facultad de Ciencias Técnicas, San José de las Laja, Mayabeque, Cuba.

iDNeili Machado-GarcíaIUniversidad Agraria de La Habana, Facultad de Ciencias Técnicas, San José de las Laja, Mayabeque, Cuba.

iDMaría Elena-Ruiz PérezIUniversidad Agraria de La Habana, Facultad de Ciencias Técnicas, San José de las Laja, Mayabeque, Cuba.


IUniversidad Agraria de La Habana, Facultad de Ciencias Técnicas, San José de las Laja, Mayabeque, Cuba.

 

*Autora para correspondencia: Ivett Sosa-Franco, e-mail: ivett@unah.edu.cu

RESUMEN

Una gran parte de la información geoespacial se encuentra almacenada en bases de datos relacionales. Las mismas proporcionan un método confiable para gestionar grandes cantidades de datos al tiempo que ofrecen una combinación de rendimiento del sistema y facilidad de implementación. Los usuarios que interactúan con estos sistemas le realizan consultas con el principal objetivo de recuperar información. Estas consultas no son más que preguntas en lenguaje natural sobre el mundo y cómo las personas se relacionan con él. En este artículo se abordan los principales temas relacionados con los Sistemas de Información Geográfica y sus herramientas más populares a nivel mundial. También se explican aspectos relevantes sobre los Sistemas de Gestión de Bases de Datos y se establece una comparación entre los Relacionales y los NoSQL. Además, se plantean los principales tipos de consultas, así como el lenguaje en el que se realizan y se muestran algunos ejemplos de las mismas.

Palabras clave
Sistemas de Información Geográfica, Sistemas de Gestión de Bases de datos, consultas

INTRODUCCIÓN

 

Los mapas y la tecnología cartográfica están prácticamente en todas partes. Aunque los modos y medios de hacer y distribuir mapas se han revolucionado con los recientes avances informáticos y tecnológicos (Bartel, 2022BARTEL, C.: “Computer Art, Technology, and the Medium”, En: Being and Value in Technology, Ed. Springer, pp. 141-161, 2022.). El arte y la ciencia de hacer mapas se remontan a siglos atrás. Esto se debe a que los humanos son organismos inherentemente espaciales, y para que puedan vivir en el mundo, primero deben relacionarse con él de alguna manera (Restrepo, 2015RESTREPO, J.C.G.: “La cartografía en el ambito de las tecnologias de la informacion y la comunicación (TIC)”, DIM: Didáctica, Innovación y Multimedia, (31): 1-18, 2015, ISSN: 1699-3748.).

Actualmente existen herramientas y programas informáticos aplicados a la geografía que permiten visualizar datos geográficos y alfanuméricos de manera integrada. Asimismo, permiten administrar la información en forma de capas de diferentes formatos y elaborar análisis espaciales con fines específicos (Mariani, 2012MARIANI, G.: “Los Sistemas de Información Geográfica (SIG) - Caja de herramientas para un Nuevo Urbanismo”, En: 14 de junio de 2012.).

DESARROLLO DEL TEMA

 

Sistemas de Información Geográfica: conceptos y principales herramientas

 

Un ejemplo de esto son los Sistemas de Información Geográfica (SIG), según Goodchild y Kemp (1990)GOODCHILD, M.F.; KEMP, K.K.: NCGIA core curriculum: introduction to GIS, Ed. National Center for Geographic Information and Analysis, University of …, vol. 1, 1990. son sistemas de información compuestos por hardware, software y procedimientos para capturar, manejar, manipular, analizar, modelar y representar datos georreferenciados, con el objetivo de resolver problemas de gestión y planificación.

Los SIG son herramientas eficaces para recopilar, almacenar y gestionar datos espaciales mediante mapas. Los métodos y herramientas SIG se utilizan ampliamente en aplicaciones de ingeniería, especialmente en el diseño, la planificación y la gestión de sistemas de transporte/logística, el diseño de instalaciones, la especificación y asignación de ubicaciones de recursos (específicamente para recursos agrícolas) y la determinación de regiones potenciales con alta demanda. Otras áreas que dependen de la recopilación, el análisis y la visualización de datos espaciales son: las telecomunicaciones, la agricultura, la minería, entre otras (Balaman, 2019BALAMAN, Ş.Y.: “Chapter 7 - Modeling and Optimization Approaches in Design and Management of Biomass-Based Production Chains”, [en línea], En: Balaman, Ş.Y. (ed.), Decision-Making for Biomass-Based Production Chains, Ed. Academic Press, pp. 185-236, 1 de enero de 2019, DOI: 10.1016/B978-0-12-814278-3.00007-8, ISBN: 978-0-12-814278-3, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780128142783000078, [Consulta: 20 de agosto de 2022].).

Un SIG permite gestionar una gran cantidad de datos e información. Desde la tarea relativamente simple de mapear la ruta que debe seguir un tractor para transportar los alimentos recién recogidos del campo hasta la tarea más compleja de determinar el proceso de siembra más eficiente, un SIG se usa en los sectores público y privado. Los servicios basados en la ubicación, la navegación y los mapas en línea y móviles también están personalizando y democratizando los SIG al llevar los mapas y la cartografía a las masas (Dastrup, 2020R. ADAM DASTRUP, M.A.: “1.4 The Future of GIS”, [en línea], En: Introduction to Geographic Information Systems, 2020, Disponible en:https://gist.pressbooks.com/chapter/1-4/, [Consulta: 29 de julio de 2022].).

Comparación entre QGIS y ArcGIS

 

En la actualidad existen diferentes aplicaciones SIG tanto comerciales como de código abierto, utilizadas por una gran cantidad de usuarios. ArcGIS y QGIS son dos de estas aplicaciones mayormente usadas cuando se habla de SIG (Maurya et ., 2015MAURYA, S.; OHRI, A.; MISHRA, S.: “Open Source GIS: A Review”, En: 9 de octubre de 2015.).

Según Khan y Mohiuddin (2018)KHAN, S.; MOHIUDDIN, K.: “Evaluating the parameters of ArcGIS and QGIS for GIS”, Int. J. Adv. Res. Sci. Eng, 7: 582-594, 2018. Applications QGIS es una herramienta SIG totalmente competente y de fácil acceso, es un programa de código abierto, gratuito a diferencia de ArcGIS. QGIS puede ser introducido en diferentes marcos de trabajo, por ejemplo, Windows, Mac OS X, Linux (Ubuntu), y Unix mientras que ArcGIS solo es soportado por Windows.

En su trabajo Maurya et al. (2015)MAURYA, S.; OHRI, A.; MISHRA, S.: “Open Source GIS: A Review”, En: 9 de octubre de 2015. afirma que existen muchos software SIG de código abierto disponibles a nivel mundial, pero QGIS es el más popular entre ellos. Asimismo, plantea que ArcGIS es el software propietario más notorio en el campo de los SIG, por lo que en varias ocasiones son comparados ambos SIG. ArcGIS tiene una excelente interfaz gráfica de usuario en comparación con cualquier software de código abierto. Sin embargo, este solo es soportado por sistemas operativos Windows, mientras que QGIS puede ser introducido en disímiles marcos de trabajo como Linux. ArcGIS cuenta con una aceptada documentación, mientras que QGIS presenta una basta y bien descrita documentación, con numerosos tutoriales y videos introductorios muy útiles y de fácil comprensión.

Según Flenniken et al. (2020)FLENNIKEN, J.M.; STUGLIK, S.; IANNONE, B.V.: “Quantum GIS (QGIS): An introduction to a free alternative to more costly GIS platforms: FOR359/FR428, 2/2020”, EDIS, 2020(2): 7-7, 2020. QGIS es una herramienta de creciente utilidad para la visualización y el análisis espacial, lo que la convierte en una alternativa viable a otros costosos paquetes de software. El mismo es un software de código abierto que se beneficia de las contribuciones de expertos y usuarios de todo el mundo. La naturaleza de código abierto de QGIS, junto con la creciente disponibilidad de datos gratuitos de fuentes en línea, ofrece una oportunidad para que los usuarios poco experimentados aprendan e incorporen la tecnología SIG en sus investigaciones.

En su trabajo Benduch (2017)BENDUCH, P.: “Comparison of the results of spatial analyses performed in arcgis and qgis software”, Infrastruktura i Ekologia Terenów Wiejskich, 2017. sugiere que QGIS podría ser una alternativa aceptable del software propietario ArcGis, en el proceso de enseñanza de los SIG, teniendo en cuenta la posibilidad financiera de las instituciones educativas y también la complejidad de sus funcionalidades.

Después de consultar varias bibliografías y analizar las opiniones de diferentes autores Khan y Mohiuddin, (2018)KHAN, S.; MOHIUDDIN, K.: “Evaluating the parameters of ArcGIS and QGIS for GIS”, Int. J. Adv. Res. Sci. Eng, 7: 582-594, 2018. Applications; Maurya et al. (2015)MAURYA, S.; OHRI, A.; MISHRA, S.: “Open Source GIS: A Review”, En: 9 de octubre de 2015.; Flenniken et al. (2020)FLENNIKEN, J.M.; STUGLIK, S.; IANNONE, B.V.: “Quantum GIS (QGIS): An introduction to a free alternative to more costly GIS platforms: FOR359/FR428, 2/2020”, EDIS, 2020(2): 7-7, 2020. y Benduch (2017)BENDUCH, P.: “Comparison of the results of spatial analyses performed in arcgis and qgis software”, Infrastruktura i Ekologia Terenów Wiejskich, 2017. se puede afirmar que tanto QGIS como ArcGIS son software SIG de alta calidad, ambos son sistemas estables y buenas propuestas al elegir un SIG. Pero, aunque ArcGIS destaca en varios aspectos y tiene el respaldo de una gran empresa detrás, su alto coste constituye una barrera para muchos usuarios. La gran ventaja de QGIS está en ser una propuesta económica ya que no se necesita de una licencia para poder utilizar todas las herramientas que este ofrece. Además, el mismo es un software libre de código abierto, por lo que está al alcance de cualquier usuario, con las mismas funcionalidades y prestaciones de un SIG de pago.

Tipos de datos en un SIG: datos espaciales y de atributos

 

QGIS al igual que otros SIG admite la visualización y el análisis de datos geográficos (Khan y Mohiuddin, 2018KHAN, S.; MOHIUDDIN, K.: “Evaluating the parameters of ArcGIS and QGIS for GIS”, Int. J. Adv. Res. Sci. Eng, 7: 582-594, 2018. Applications). Además, ofrece múltiples facilidades, como la captura, gestión y consulta de datos. Permite a los usuarios visualizar y comprender las relaciones entre los datos geográficos en forma de mapas, informes y gráficos. Los tipos de datos básicos disponibles definen los datos habituales en un mapa. Existen principalmente dos tipos de datos: los de atributos y los espaciales (Lithmee, 2019LITHMEE: “What is the Difference Between Attribute Data and Spatial Data”, [en línea], En: Pediaa.Com, 3 de marzo de 2019, Disponible en:https://pediaa.com/what-is-the-difference-between-attribute-data-and-spatial-data/, [Consulta: 20 de agosto de 2022].).

Datos espaciales

 

Los datos espaciales describen información geométrica, como la ubicación de una entidad en el espacio o la posición relativa a otras entidades. Además, los mismos son multidimensionales y abarcan varios datos diferentes, aunque correlacionados (Howari y Ghrefat, 2021HOWARI, F.M.; GHREFAT, H.: “Chapter 4 - Geographic information system: spatial data structures, models, and case studies”, [en línea], En: Mohamed, A.-M.O.; Paleologos, E.K. y Howari, F.M. (eds.), Pollution Assessment for Sustainable Practices in Applied Sciences and Engineering, Ed. Butterworth-Heinemann, pp. 165-198, 1 de enero de 2021, DOI: 10.1016/B978-0-12-809582-9.00004-9, ISBN: 978-0-12-809582-9, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780128095829000049, [Consulta: 21 de agosto de 2022].).

Los mismos comprenden la información geográfica relativa sobre la tierra y sus características. Un par de coordenadas de latitud y longitud define una ubicación específica en la tierra. Estos son de dos tipos, según la técnica de almacenamiento: datos ráster y datos vectoriales (Janipella et al., 2019JANIPELLA, R.; GUPTA, V.; MOHARIR, R.V.: “Chapter 8 - Application of Geographic Information System in Energy Utilization”, [en línea], En: Kumar, S.; Kumar, R. y Pandey, A. (eds.), Current Developments in Biotechnology and Bioengineering, Ed. Elsevier, pp. 143-161, 1 de enero de 2019, DOI: 10.1016/B978-0-444-64083-3.00008-7, ISBN: 978-0-444-64083-3, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780444640833000087, [Consulta: 21 de agosto de 2022].):

  • Los datos ráster se componen de celdas de cuadrícula identificadas por fila y columna. Toda el área geográfica se divide en grupos de celdas individuales, que representan una imagen. Imágenes de satélite, fotografías e imágenes escaneadas, son ejemplos de datos ráster (Figura 1, derecha).

  • Los datos vectoriales se componen de puntos, polilíneas y polígonos. Los pozos, las casas, entre otros, se representan mediante puntos. Las carreteras, ríos y arroyos, se representan mediante polilíneas. Los pueblos y ciudades están representados por polígonos (Figura 1, izquierda).

FIGURA 1.  Datos vectoriales (izquierda) y datos ráster (Derecha). Fuente: (Dempsey, 2022DEMPSEY, C.: “Types of GIS Data Explored: Vector and Raster”, GIS Lounge, 1 de julio de 2022, Disponible en:https://www.gislounge.com/geodatabases-explored-vector-and-raster-data/, [Consulta: 21 de agosto de 2022].).

Datos de atributos

 

Los datos de atributos son descripciones o medidas de características geográficas en un mapa. Se refiere a datos detallados que se combinan con datos geoespaciales. Los datos de atributos ayudan a obtener la información significativa de una tarjeta. Cada característica tiene propiedades que se pueden describir. Por ejemplo, un edificio: este tiene un año de construcción, el número de pisos, entre otras características o atributos. También pueden ser hechos que se conocen pero que no son visibles, como el año de construcción. Además, pueden representar la falta de una característica (Lithmee, 2019LITHMEE: “What is the Difference Between Attribute Data and Spatial Data”, [en línea], En: Pediaa.Com, 3 de marzo de 2019, Disponible en:https://pediaa.com/what-is-the-difference-between-attribute-data-and-spatial-data/, [Consulta: 20 de agosto de 2022].).

Estos datos comprenden la información pertinente sobre los datos espaciales. La función de consulta trabaja en función de los datos de atributos, es decir, se adjunta a los datos geoespaciales. Los tipos de datos de atributos son (Janipella et al., 2019JANIPELLA, R.; GUPTA, V.; MOHARIR, R.V.: “Chapter 8 - Application of Geographic Information System in Energy Utilization”, [en línea], En: Kumar, S.; Kumar, R. y Pandey, A. (eds.), Current Developments in Biotechnology and Bioengineering, Ed. Elsevier, pp. 143-161, 1 de enero de 2019, DOI: 10.1016/B978-0-444-64083-3.00008-7, ISBN: 978-0-444-64083-3, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780444640833000087, [Consulta: 21 de agosto de 2022].):

  • Datos nominales: describen diferentes tipos de categorías de datos, como los tipos de uso de la tierra o los tipos de suelo.

  • Datos ordinales: diferencian los datos por su relación de clasificación. Por ejemplo, las ciudades pueden agruparse en grandes, medianas y pequeñas según el tamaño de la población.

  • Datos de intervalo: tienen intervalos conocidos entre los valores, como la lectura de la temperatura. Por ejemplo, una lectura de temperatura de 30 °C es más caliente que 20 °C por 10 °C.

  • Datos de proporción: son los mismos que los datos de intervalo, excepto que los datos de proporción se basan en un valor significativo o cero absolutos. Las densidades de población son un ejemplo de datos de relación, porque una densidad de 0 es un cero absoluto.

Para el almacenamiento y organización de los datos geográficos se utilizan bases de datos. Los SIG utilizan entre otras fuentes de datos las bases de datos espaciales las cuales permiten a los usuarios tener acceso a información actualizada sin necesidad de tener los ficheros espaciales físicamente. Si el usuario tiene acceso a la base de datos espacial tendrá acceso a la información espacial almacenada en esta. Las mismas permiten minimizar la posibilidad de errores en el manejo de la información ya que facilitan la eliminación de redundancias e inconsistencias. Además, ayudan a estructurar y organizar los datos de una manera eficiente y funcional (Nur et al., 2018NUR, W.H.; KUMORO, Y.; SUSILOWATI, Y.: “GIS and Geodatabase Disaster Risk for Spatial Planning”, IOP Conference Series: Earth and Environmental Science, 118: 012046, febrero de 2018, ISSN: 1755-1315, DOI: 10.1088/1755-1315/118/1/012046.).

Bases de datos

 

Una base de datos es un listado o una agrupación de datos, normalmente reunidos de forma que se pueda acceder a ellos rápidamente. Sin embargo, especialmente en el mundo actual, una base de datos puede ser tan simple como una libreta de direcciones que contenga una lista de nombres y direcciones hasta algo tan sofisticado como un conjunto o banco de datos completo de miles de registros de clientes (Maliakal, 2019MALIAKAL, G.: “Chapter Two - Database Management”, [en línea], En: Levin-Epstein, M. (ed.), Careers in Biomedical Engineering, Ed. Academic Press, pp. 19-36, 1 de enero de 2019, DOI: 10.1016/B978-0-12-814816-7.00002-9, ISBN: 978-0-12-814816-7, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780128148167000029, [Consulta: 22 de agosto de 2022].).

Las bases de datos son colecciones de datos relacionados organizados de manera que se pueda acceder, administrar y actualizar fácilmente los datos. Las mismas pueden estar basadas en software o hardware, con un único propósito, almacenar datos (Cai y Vasilakos, 2017CAI, H.; VASILAKOS, A.V.: “Chapter 12 - Web of Things Data Storage”, [en línea], En: Sheng, Q.Z.; Qin, Y.; Yao, L. y Benatallah, B. (eds.), Managing the Web of Things, Ed. Morgan Kaufmann, Boston, pp. 325-354, 1 de enero de 2017, DOI: 10.1016/B978-0-12-809764-9.00015-9, ISBN: 978-0-12-809764-9, Disponible en:https://www.sciencedirect.com/science/article/pii/B9780128097649000159, [Consulta: 22 de agosto de 2022].).

Sistema de Gestión de Bases de Datos

 

Un sistema de gestión de bases de datos (SGBD), es un software diseñado para ayudar a mantener y utilizar grandes colecciones de datos, y la necesidad de estos sistemas, así como su uso, está creciendo rápidamente. Los sistemas de gestión de bases de datos ofrecen varias funciones además de la gestión de archivos; permiten la concurrencia, controlan la seguridad, mantienen la integridad de los datos, proporcionan una copia de seguridad y recuperación, controlan la redundancia, permiten la independencia de los datos y proporcionan un lenguaje de consulta no procedimental (Singh, 2015SINGH, S.: “DATABASE MANAGEMENT SYSTEM”, Journal of Management Research and Analysis, 2(1): 72-80, Company: IP Innovative Publication Pvt. Ltd.Distributor: IP Innovative Publication Pvt. Ltd.Institution: IP Innovative Publication Pvt. Ltd.Label: IP Innovative Publication Pvt. Ltd.number: 1publisher: Ip Innovative Publication Pvt. Ltd., 15 de abril de 2015, ISSN: 2394-2770.).

Los SGBD se diseñaron para facilitar el almacenamiento y la recuperación de grandes colecciones de datos. Incluyen funciones de protección y seguridad de estos, mantenimiento de la coherencia de los datos almacenados y la disponibilidad de los mismos para múltiples usuarios al mismo tiempo (Rawat y Purnama, 2021RAWAT, B.; PURNAMA, S.: “MySQL Database Management System (DBMS) On FTP Site LAPAN Bandung”, International Journal of Cyber and IT Service Management, 1(2): 173-179, 2021.).

Comparación entre Sistemas de Gestión de Base de Datos Relacionales y NoSQL

 

Existen diversos tipos de SGBD: relacional, distribuido, NoSQL, orientado a objetos y orientado a gráficas, esto se debe a la variedad de la forma de trabajo que se requiere de ellos. Entre los más usadas para el trabajo con los QGIS se encuentran los Sistemas de Gestión de Base de Datos Relacionales (SGBDR) como PostgreSQL y los sistemas de gestión de bases de datos NoSQL como MongoDB (Nayak et al., 2013NAYAK, A.; PORIYA, A.; POOJARY, D.: “Type of NOSQL databases and its comparison with relational databases”, International Journal of Applied Information Systems, 5(4): 16-19, 2013.).

Según Guillot-Jiménez y García (2016)GUILLOT JIMÉNEZ, J.; GARCÍA, L.: “Bases de datos NoSQL para la gestión de datos geoespaciales”, En: 16 de marzo de 2016, DOI: 10.13140/RG.2.1.3803.0481. los sistemas de gestión de bases de datos NoSQL constituyen una excelente opción para aplicaciones que requieran de la gestión eficiente de datos semiestructurados y no estructurados y de una alta disponibilidad por parte de los usuarios finales. Para el manejo de datos geoespaciales destacan los sistemas orientados a documentos y los orientados a grafos sobre aquellos que poseen un modelo de datos del tipo llave/valor y los orientados a columnas. Aunque el dominio más amplio en lo referido a la gestión de datos geoespaciales continúa estando en manos de los sistemas relacionales.

En su trabajo Guo y Onstein (2020)GUO, D.; ONSTEIN, E.: “State-of-the-art geospatial information processing in NoSQL databases”, ISPRS International Journal of Geo-Information, 9(5): 331, 2020. plantean que las bases de datos NoSQL como MongoDB son muy útiles para el trabajo de datos geoespaciales, ya que se cargan rápidamente y tienen un buen tiempo de ejecución, asimismo presentan un buen rendimiento de consulta y abundantes funciones geoespaciales y métodos de indexación. Dependiendo del escenario de la aplicación, las bases de datos gráficas, las bases de datos de valor clave y las bases de datos de columnas anchas también tienen sus propias ventajas. Además, el cálculo de superficies geométricas y el procesamiento de volúmenes no se manejan en las bases de datos NoSQL existentes.

Según Nasution (2021)NASUTION, M.: Relational Database Management Systems, 2 de marzo de 2021. un SGBDR es un software utilizado para almacenar, gestionar, consultar y recuperar los datos almacenados en una base de datos relacional. Este proporciona una interfaz entre los usuarios y las aplicaciones y la base de datos, así como funciones administrativas para gestionar el almacenamiento, el acceso y el rendimiento de los datos.

En su trabajo Twumasi (2002)TWUMASI, B.O.: “Modelling spatial object behaviours in object-relational geodatabase”, En: Ed. Citeseer, 2002. plantea que uno de los modelos de base de datos bien establecidos a nivel lógico es el modelo relacional, que organiza los datos en tablas. Estas tablas son manipuladas por un SGBDR. Los SIG han utilizado tradicionalmente bases de datos relacionales para el almacenamiento de sus datos. A pesar de su limitada capacidad para captar el comportamiento de los objetos, la tecnología relacional está matemáticamente bien establecida en el campo de las bases de datos.

Según Yue y Tan (2017)YUE, P.; TAN, Z.: “GIS Databases and NoSQL Databases”, En: Reference Module in Earth Systems and Environmental Sciences, journalAbbreviation: Reference Module in Earth Systems and Environmental Sciences, 31 de diciembre de 2017, DOI: 10.1016/B978-0-12-409548-9.09596-8, ISBN: 978-0-12-409548-9. los SGBDR, que se basan en modelos relacionales de datos geográficos, han dominado el mercado empresarial durante mucho tiempo y desempeñan un papel importante en la moderna sociedad de la información. Los modelos relacionales se basan en conjuntos de álgebra con rigurosos fundamentos matemáticos y capacidades de análisis formal.

En su trabajo Hammersley (2018)HAMMERSLEY, B.: “SQL vs NoSQL: A Spatial Benchmark for Selected NoSQL and Relational Database Management Systems”, 2018. opina que los SGBDR han estado a la vanguardia en el campo de los SIG como QGIS durante muchos años. En su investigación plantea que luego de una prueba de rendimiento de SGBD escalables comparando dos SGBDR con un SGBD de documentos y un SGBD de gráficos, los resultados muestran que los SGBDR son en general superiores, en cuanto a sentencias de unión, extracción de estadísticas significativas, actualizaciones parciales de registros e integridad referencial.

Luego del análisis y consulta de diferentes bibliografías Guillot-Jiménez y García (2016)GUILLOT JIMÉNEZ, J.; GARCÍA, L.: “Bases de datos NoSQL para la gestión de datos geoespaciales”, En: 16 de marzo de 2016, DOI: 10.13140/RG.2.1.3803.0481.; Guo y Onstein (2020)GUO, D.; ONSTEIN, E.: “State-of-the-art geospatial information processing in NoSQL databases”, ISPRS International Journal of Geo-Information, 9(5): 331, 2020.; Hammersley (2018)HAMMERSLEY, B.: “SQL vs NoSQL: A Spatial Benchmark for Selected NoSQL and Relational Database Management Systems”, 2018.; Twumasi (2002)TWUMASI, B.O.: “Modelling spatial object behaviours in object-relational geodatabase”, En: Ed. Citeseer, 2002. y Yue y Tan (2017)YUE, P.; TAN, Z.: “GIS Databases and NoSQL Databases”, En: Reference Module in Earth Systems and Environmental Sciences, journalAbbreviation: Reference Module in Earth Systems and Environmental Sciences, 31 de diciembre de 2017, DOI: 10.1016/B978-0-12-409548-9.09596-8, ISBN: 978-0-12-409548-9. se puede afirmar que tanto los SGBDR como los NoSQL son bases de datos recomendadas para utilizar a la hora de comenzar en proyectos SIG, cada una de ellas con sus ventajas y desventajas. Sin embargo, los SGBDR brindan un mayor soporte y más variedad de herramientas debido a que llevan más tiempo en el mercado. Los sistemas relacionales son considerados los más populares entre las organizaciones de todo el mundo ya que proporcionan un método confiable para almacenar y recuperar grandes cantidades de datos al tiempo que ofrece una combinación de rendimiento del sistema y facilidad de implementación. Además, son útiles para manejar y obtener datos geográficos.

PostgreSQL

 

Existen SGBDR con licencia privativa y comercial, entre estos se encuentran: Microsoft SQL Server, Oracle y DB2 siendo su coste significativo en algunos casos solo alcanzable por grandes organizaciones. Sin embargo, también se pueden encontrar software libres, de código abierto tan potentes y eficaces como los de pago (Garrido et al., 2021PILICITA GARRIDO, A.; BORJA LÓPEZ, Y.; GUTIÉRREZ CONSTANTE, G.: “Rendimiento de MariaDB y PostgreSQL”, 2021.).

Según Ismail-Hossain et al. (2019)ISMAIL HOSSAIN, M.; MAHMUD, S.; SANTA, T.D.: “Oracle, MySQL, PostgreSQL, SQLite, SQL Server: Performance based competitive analysis”, 2019. y Wodyk y Skublewska-Paszkowska (2020)WODYK, R.; SKUBLEWSKA-PASZKOWSKA, M.: “Performance comparison of relational databases SQL Server, MySQL and PostgreSQL using a web application and the Laravel framework”, Journal of Computer Sciences Institute, 17: 358-364, 2020. afirman que entre los SGBDR de código abierto más populares del mercado a nivel mundial se encuentran SQLite, MySQL y PostgreSQL. Cada uno tiene sus propias características y limitaciones únicas, y sobresalen en escenarios particulares. SQLite destaca en aplicaciones pequeñas mientras que PostgreSQL resalta gracias a características como el procesamiento paralelo y la concurrencia. Además, garantiza la confiabilidad y la integridad de los datos y es ideal para proyectos científicos y de investigación.

PostgreSQL cuenta con un amplio conjunto de tipos de datos, permitiendo su extensión mediante tipos y operadores definidos y programados por el usuario. Su administración se basa en usuarios y privilegios y es altamente confiable en cuanto a estabilidad se refiere. Los mensajes de error pueden estar en español y hacer ordenaciones correctas con palabras acentuadas o con la letra ‘ñ’. Puede extenderse con librerías externas para soportar encriptación, búsquedas por similitud fonética, entre otros. Posibilita el control de concurrencia multi-versión, lo que mejora sensiblemente las operaciones de bloqueo y transacciones en sistemas multi-usuario y es posible definir un nuevo tipo de tabla a partir de otra previamente definida (Ginestà y Mora, 2012GINESTÀ, M.G.; MORA, O.P.: “Bases de datos en PostgreSQL”, Sl]:[sn], 2012.).

Bases de datos espaciales

 

PostgreSQL al igual que otros SGBDR por sí solo no permite el almacenamiento de la ubicación física y la forma de los objetos geométricos dentro de las tablas, para esto se necesita una base de datos espacial (Hess, 2022HESS, P.T.: Building a Spatial Database for Agricultural Record Keeping and Management on a Regenerative Farm, University of Southern California, 2022.).

Las bases de datos espaciales permiten la representación de objetos geométricos simples como puntos, líneas y polígonos. Algunas manejan estructuras más complejas como objetos 3D, coberturas topológicas, redes lineales y redes irregulares trianguladas. Dichas bases de datos requieren una funcionalidad adicional para procesar los tipos de datos espaciales de manera eficiente, y los desarrolladores a menudo han agregado tipos de datos geométricos o de características (Salleh et al., 2021SALLEH, S.; UJANG, U.; AZRI, S.: “3D TOPOLOGICAL SUPPORT IN SPATIAL DATABASES: AN OVERVIEW.”, International Archives of the Photogrammetry, Remote Sensing & Spatial Information Sciences, 46, 2021.).

Las bases de datos espaciales son extensiones de las bases de datos clásicas que contienen objetos, procedimientos y mecanismos especiales para almacenar y manipular datos geoespaciales (Maina et al., 2019MAINA, J.; OUMA, P.O.; MACHARIA, P.M.; ALEGANA, V.A.; MITTO, B.; FALL, I.S.; NOOR, A.M.; SNOW, R.W.; OKIRO, E.A.: “A spatial database of health facilities managed by the public health sector in sub Saharan Africa”, Scientific data, 6(1): 1-8, 2019.).

PostGIS extensión de PostgreSQL

 

PostGIS es la extensión para el SGBDR PostgreSQL, este almacena el objeto espacial en el formato estándar Well Known Binary (WKB, por sus siglas en inglés). El mismo hereda automáticamente las características de las bases de datos empresariales, así como los estándares abiertos que implementa un SIG dentro del motor de base de datos (Belciu et al., 2014BELCIU, A.; DIACONITA, V.; LUNGU, I.; VIRGOLICI, A.-M.: “Development of Spatial Database for Regional Development in Romania”, Informatica Economica, 18(3): 55, 2014.).

Entre los principales datos utilizados por PostGIS se encuentran: punto (point), cadena de líneas (linestring), polígono (polygon), multipunto(multipoint), multilínea (multilinestring) y multipolígono (multipolygon) (Leslie y Ramsey, 2022LESLIE, M.; RAMSEY, P.: “Introduction to PostGIS”, 2022.). Este ofrece la posibilidad de cargar masivamente los datos desde shapefiles1Formato de archivos de ESRI que almacena datos geoespaciales.. Se publicó bajo la licencia GNU GPL, lo que significa que está disponible como software de código abierto (Hsu y Obe, 2021HSU, L.S.; OBE, R.: PostGIS in action, Ed. Simon and Schuster, 2021, ISBN: 1-61729-669-4.).

Consultas SQL

 

PostgreSQL al igual que otros SGBDR les permite a los usuarios la introducción de consultas para recuperar o manipular los datos necesarios para funciones de trabajo específicas. El propósito principal de una consulta es recuperar información, esta función permite a los usuarios acceder a la información o cambiar los datos de alguna manera, como agregar o eliminar información (Baik et al., 2019BAIK, C.; JAGADISH, H.V.; LI, Y.: “Bridging the semantic gap with SQL query logs in natural language interfaces to databases”, En: 2019 IEEE 35th International Conference on Data Engineering (ICDE), Ed. IEEE, pp. 374-385, 2019, ISBN: 1-5386-7474-2.).

El proceso de recuperación se lleva a cabo mediante consultas donde se almacena la información estructurada, mediante un lenguaje de interrogación adecuado. Es necesario tener en cuenta los elementos clave que permiten hacer la búsqueda, determinando un mayor grado de pertinencia y precisión, como son: los índices, palabras clave y los problemas que se pueden dar en el proceso (Kul et al., 2018KUL, G.; LUONG, D.T.A.; XIE, T.; CHANDOLA, V.; KENNEDY, O.; UPADHYAYA, S.: “Similarity metrics for SQL query clustering”, IEEE Transactions on Knowledge and Data Engineering, 30(12): 2408-2420, 2018.).

Las consultas tienen otras funciones importantes, incluido el filtrado de datos, la presentación clara de resultados, la compilación de información y la adición de criterios (Uma et al., 2019UMA, M.; SNEHA, V.; SNEHA, G.; BHUVANA, J.; BHARATHI, B.: “Formation of SQL from natural language query using NLP”, En: 2019 International Conference on Computational Intelligence in Data Science (ICCIDS), Ed. IEEE, pp. 1-5, 2019, ISBN: 1-5386-9471-9.).

SQL, lenguaje de consulta estructurado

 

PostgreSQL utiliza el Lenguaje de Consulta Estructurado (SQL, por sus siglas en inglés) como lenguaje de programación para realizar las consultas. (Shin et al., 2018SHIN, M.E.; CAMPBELL, J.; BURKHART, N.: Essentials of Geographic Information Systems, Ed. FlatWorld, 2018, ISBN: 1-4533-9080-4.). Cuando las sentencias que provee SQL son utilizas de manera eficiente, permite la creación de sistemas altamente escalables, flexibles y manejables (Pino et al., 2018PINO, A.V.; PONCE, J.; MORETA, O.E.: “Análisis de la optimización de sentencias SQL del Lenguaje de Consulta Estructurado usando grandes volúmenes de datos”, Revista Publicando, 5(16 (1)): 70-79, 2018.).

SQL implementa cláusulas para estructurar las consultas. Una cláusula es un elemento de lenguaje que incluye las instrucciones de consulta select (seleccionar), from (de), where (donde), order by (ordenar por) y having(teniendo) (Pratt, 2009PRATT, M.: “Asking the Right Questions”, 2009.).

  • Select indica qué campos de la tabla de atributos desea ver.

  • From denota la tabla de atributos en la que reside la información.

  • Where denota los criterios definidos por el usuario para la información de atributo que se debe cumplir para que se incluya en el conjunto de salida.

  • Order by denota la secuencia en la que se mostrará el conjunto de salida.

  • Having indica el predicado utilizado para filtrar la salida de la cláusula order by.

Si bien las cláusulas select y from son declaraciones obligatorias en una consulta SQL, where es una cláusula opcional que se usa para limitar el conjunto de resultados. order by y having son cláusulas opcionales que se utilizan para presentar la información de manera interpretable (Shin et al., 2018SHIN, M.E.; CAMPBELL, J.; BURKHART, N.: Essentials of Geographic Information Systems, Ed. FlatWorld, 2018, ISBN: 1-4533-9080-4.).

TABLA 1.  Ejemplos de consultas SQL. Fuente: elaboración propia
Consultas SQL Preguntas en lenguaje natural
select * from cultivos order by cultivo.area Muestre los cultivos cuya área de sembrado sea mayor
select * from cultivos where cultivo.produccion > 20 Cultivo cuya producción sea mayor que 20 t
select * from cultivos where cultivos.nombre like ‘arroz’ order by cultivos.produccion descending Mostrar las producciones de arroz de mayor a menor

Las consultas SQL se corresponden a preguntas confeccionadas por los usuarios donde la estructura de las sentencias SQL es similar a la del lenguaje natural (Taipalus et al., 2018TAIPALUS, T.; SIPONEN, M.; VARTIAINEN, T.: “Errors and complications in SQL query formulation”, ACM Transactions on Computing Education (TOCE), 18(3): 1-29, 2018.).

Según Shin et al. (2018)SHIN, M.E.; CAMPBELL, J.; BURKHART, N.: Essentials of Geographic Information Systems, Ed. FlatWorld, 2018, ISBN: 1-4533-9080-4. las consultas SQL no son más que preguntas en lenguaje natural sobre el mundo y cómo las personas se relacionan con él. Estas preguntas pueden ser simples con un enfoque local o más complejas con una perspectiva más global.

Consultas en SIG

 

La presencia de un SGBDR como PostgreSQL dentro del SIG QGIS permite la realización de consultas a este, la misma es una llamada a dicho sistema gestor, el cual devuelve como respuesta una serie de elementos tomados de la información contenida en la base de datos. Es decir, del total de datos se obtiene como consecuencia de la consulta una parte de los mismos. La respuesta a la consulta es un conjunto de elementos, de la misma forma que si en un mapa impreso se pregunta ¿qué hay aquí? y se obtiene como respuesta los datos correspondientes al punto que se señaló. Estos datos son una fracción particular del conjunto de todos los contenidos en dicho mapa (Olaya, 2014OLAYA, V.: Sistemas de información geográfica. Un libro libre de Víctor Olaya, Ed. Obtenido de: http://volaya.github.io/librosig/chapters …, 2014.).

Uno de los análisis que se puede realizar sobre una capa de información geográfica dentro de QGIS es la consulta de esta. Se entiende por consulta a una operación en la cual se pregunta a los datos geográficos algún tipo de cuestión simple, generalmente basada en conceptos formales sencillos. Este tipo de análisis, aunque no implica el uso de conceptos analíticos complejos, es uno de los elementos clave de los SIG, pues es parte básica del empleo diario de estos (Pratt, 2009PRATT, M.: “Asking the Right Questions”, 2009.).

Tipos de consultas en SIG

 

Después de analizar varias bibliografías Olaya (2014)OLAYA, V.: Sistemas de información geográfica. Un libro libre de Víctor Olaya, Ed. Obtenido de: http://volaya.github.io/librosig/chapters …, 2014.; Shin et al. (2018)SHIN, M.E.; CAMPBELL, J.; BURKHART, N.: Essentials of Geographic Information Systems, Ed. FlatWorld, 2018, ISBN: 1-4533-9080-4. y Pratt (2009)PRATT, M.: “Asking the Right Questions”, 2009. se puede apreciar que cada autor tiene su forma particular para clasificar los tipos de consultas en un SIG. Independientemente de ello los autores hacen referencia a los mismos tipos de consultas, pudiéndose clasificar las mismas en tres tipos fundamentales: selección, consultas por atributos y consultas espaciales.

Selección

 

La selección representa la forma más fácil de buscar y consultar datos espaciales. La selección de funciones resalta los atributos de interés, tanto en pantalla como en la tabla de atributos, para su posterior visualización o análisis. Para lograr esto, se seleccionan puntos, líneas y polígonos simplemente usando el cursor para “apuntar y hacer clic” en la característica de interés o usando el cursor para arrastrar un cuadro alrededor de esas características. Alternativamente, se pueden seleccionar características mediante el uso de un objeto gráfico, como un círculo, una línea o un polígono, para resaltar todas las características que se encuentran dentro del objeto (Shin et al., 2018SHIN, M.E.; CAMPBELL, J.; BURKHART, N.: Essentials of Geographic Information Systems, Ed. FlatWorld, 2018, ISBN: 1-4533-9080-4.)

Las opciones avanzadas para seleccionar subconjuntos de datos del conjunto de datos más grande incluyen la creación de una nueva selección, la selección de las características seleccionadas actualmente, la adición a la selección actual y la eliminación de la selección actual (Olaya, 2014OLAYA, V.: Sistemas de información geográfica. Un libro libre de Víctor Olaya, Ed. Obtenido de: http://volaya.github.io/librosig/chapters …, 2014.).

Consulta por atributo

 

La consulta de atributos requiere el tratamiento de los datos de atributos. En otras palabras, se trata de un proceso de selección de información mediante la formulación de preguntas lógicas. Las consultas de atributos adoptan efectivamente la forma de una pregunta. La manera más fácil de conceptualizarlo es que se está construyendo una frase utilizando una sintaxis especial que seleccionará un subconjunto de sus datos como resultado (Shnizai, 2011SHNIZAI, Z.: Spatial and Attribute Querying, 12 de noviembre de 2011.).

Las características del mapa y sus datos asociados se pueden recuperar a través de la consulta de información de atributos dentro de las tablas de datos. Por ejemplo, las herramientas de búsqueda y consulta le permiten a un usuario mostrar todos los terrenos productivos cuya área sea mayor que 5 ha, mostrar los terrenos sembrados con arroz con mayor producción, entre otros (Shin et al., 2018SHIN, M.E.; CAMPBELL, J.; BURKHART, N.: Essentials of Geographic Information Systems, Ed. FlatWorld, 2018, ISBN: 1-4533-9080-4.).

Los atributos pueden ser valores numéricos, cadenas de texto, valores booleanos (es decir, verdadero o falso) o fechas. Este tipo de consulta es similar a una consulta realizada a cualquier base de datos; sin embargo, las respuestas, es decir las características relacionadas con los registros seleccionados por el proceso se destacan en el mapa, así como en la tabla (Pratt, 2009PRATT, M.: “Asking the Right Questions”, 2009.).

Consulta espacial

 

Las consultas espaciales son consultas en una base de datos espacial que pueden responderse únicamente a partir de la información geométrica, es decir, la posición espacial y la extensión de los objetos implicados. Las mismas también conocidas como "consultas por geografía", permiten resaltar atributos particulares al examinar su posición en relación con otras características (Shin et al., 2018SHIN, M.E.; CAMPBELL, J.; BURKHART, N.: Essentials of Geographic Information Systems, Ed. FlatWorld, 2018, ISBN: 1-4533-9080-4.).

Las funciones de las consultas espaciales permiten encontrar, mostrar y/o aislar los registros de atributos conectados a las características del mapa situadas dentro de un área de interés definida. La consulta espacial implica la selección de características basadas en la ubicación o en las relaciones espaciales, lo que requiere el procesamiento de la información espacial. Las consultas espaciales son una herramienta útil con la capacidad de encontrar cómo o dónde se relacionan espacialmente dos o más conjuntos de datos. (Shnizai, 2011SHNIZAI, Z.: Spatial and Attribute Querying, 12 de noviembre de 2011.).

Relaciones espaciales

 

La relación espacial es el componente central de una consulta espacial. Es una relación entre características espaciales con respecto a sus ubicaciones espaciales y arreglos espaciales. Existen tres tipos de relaciones espaciales en SIG: relaciones de proximidad, relaciones topológicas y relaciones de dirección (Dan et al., 2020DAN, S.; KORDJAMSHIDI, P.; BONN, J.; BHATIA, A.; CAI, J.; PALMER, M.; ROTH, D.: “From spatial relations to spatial configurations”, arXiv preprint arXiv:2007.09557, 2020.).

  • Relaciones topológicas: no se ven afectadas por la transformación bicontinua, como el estiramiento, el desplazamiento, la rotación o la flexión de las características espaciales involucradas.

  • Relaciones de proximidad: se refieren a las relaciones espaciales basadas en distancias entre entidades.

  • Relaciones de dirección: está basada en la separación angular de una característica en relación con otra característica en un sistema de coordenadas.

Las consultas pueden hacerse sobre la componente de atributos de los datos, sobre la espacial, o sobre ambas. En cualquier caso, las mismas se encuentran vinculadas, por lo que el resultado de la consulta afecta a ambas. La selección se hace patente sobre ambas componentes, con independencia de cuál de ellas haya sido la encargada de aplicar el criterio de selección. Tanto la tabla de atributos como la representación visual de la componente espacial se ven afectadas por la realización de una consulta.

CONCLUSIONES

 

Los SIG son herramientas eficaces para recopilar, almacenar y gestionar datos espaciales. También que existen herramientas SIG de código abierto muy populares a nivel mundial por su fácil acceso y competitividad, entre ellas se encuentra QGIS. Esta utiliza bases de datos relacionales para almacenar y gestionar los datos geográficos. Los SGBDR como PostgreSQL permiten minimizar la posibilidad de errores en el manejo de la información ya que facilitan la eliminación de redundancias e inconsistencias. QGIS junto a PostgreSQL a través de la extensión PostGIS para trabajar con bases de datos espaciales constituye una poderosa herramienta al procesar datos georreferenciados. Así mismo se pudo concluir que para recuperar o manipular información las personas deben realizarle consultas a este sistema de base de datos. Estas no son más que preguntas en lenguaje natural confeccionadas por los usuarios que trabajan con QGIS. Estas preguntas se realizan en lenguaje SQL y se clasifican en tres tipos fundamentales: consultas por selección, consultas de atributos y consultas espaciales. Cualquiera de las tres va a arrojar resultados verídicos no importa si se usan por separado o combinándolas.