
Introdução
Não é de se surpreender que identificar locais ideais para a construção de um novo parque eólico não seja tão trivial quanto encontrar o campo aberto mais próximo sem uma turbina eólica imponente. De fato, a identificação dos locais mais adequados exige o conhecimento de uma infinidade de características pertinentes ao local em questão. Algumas delas são regulatórias: "Estamos suficientemente longe da cidade mais próxima?", "Qual o grau de proteção natural recomendado para esta área?". Outras são práticas: "O terreno é adequado para construção?", "Esta área recebe vento suficiente para tornar uma nova turbina eólica lucrativa?". Responder a esse conjunto de perguntas com precisão, conforme recomendado pelas principais partes interessadas, é um pré-requisito para o sucesso de qualquer grande projeto de construção. Neste projeto, recorremos à utilização de dados climáticos, imagens de observação da Terra e regulamentações para identificar com eficiência áreas em Salzburgo que atendiam a um conjunto de critérios predefinidos. Este é um exemplo exemplar de como o big data pode ser utilizado em um caso de uso real e fornece insights sobre o número de considerações que precisam ser feitas em cada etapa do processo.
Obtenção dos dados
Naturalmente, o primeiro passo para qualquer tarefa que pretenda utilizar conjuntos de dados geoespaciais para responder a uma questão de interesse prático/comercial é a obtenção dos dados. Como qualquer Cientista de Dados sabe, esta é a etapa mais crítica: todos os problemas que surgem decorrem, em última análise, das decisões/escolhas tomadas aqui. Uma preocupação particular ao desenvolver uma solução para uma aplicação comercial é que os dados obtidos não sejam apenas precisos, mas também, idealmente, certificados pelas autoridades competentes. Um mapa detalhado de informações de zoneamento, por exemplo, não tem valor algum se não for possível certificar que tenha vindo diretamente da autoridade competente. Por esta razão, as fontes de dados oficiais são de altíssimo valor, pois fornecem não apenas as informações básicas necessárias, mas também a legitimidade para quaisquer conclusões ou previsões que possam ser extraídas delas. Neste projeto, o Bundesamt für Eich- und Vermessungswesen (Escritório Federal de Metrologia e Topografia) da Áustria, bem como o recurso de Dados Governamentais Abertos (OGD) fornecido pelo estado de Salzburgo, serviram como uma excelente base para o desenvolvimento do nosso levantamento prático de terras de parques eólicos.
Aproveitando Insights
Como já mencionado, a identificação de locais ideais para a construção de novos parques eólicos é decomposta em uma série de critérios quantificáveis que fornecem uma caracterização binária de uma determinada área de interesse ("Apto para a construção de um parque eólico", "Não apto para a construção de um parque eólico"). Assim, o não cumprimento de qualquer um desses critérios resultaria na desconsideração da área em qualquer análise posterior. O que essa metodologia permite é um esquema de classificação "rápido e fácil" para identificar a aptidão de uma região para a construção de um parque eólico.
A implementação do processo descrito acima pode ser dividida da seguinte forma:
Primeiramente, cada critério foi associado a uma fonte de dados que forneceu informações de verdade suficientes para responder a essa pergunta de forma positiva ou negativa. Em seguida, para cada critério, as informações de verdade associadas foram processadas para classificar a adequação de cada região de Salzburgo em relação aos critérios em questão. Dessa forma, uma camada vetorial foi gerada para cada critério, classificando as áreas de Salzburgo em regiões "Adequadas" ou "Inadequadas". A seguir, analisaremos rapidamente a geração de duas dessas camadas.
Identificação de áreas residenciais
Um dos principais critérios a serem seguidos para a construção de um novo parque eólico é que ele esteja a uma distância adequada das principais áreas residenciais. O cumprimento desse critério é uma necessidade na maioria das áreas devido à regulamentação governamental em vigor para lidar com preocupações relacionadas à poluição sonora, ao planejamento urbano e ao impacto visual dessas instalações. A utilização de dados de campo obtidos do Bundesamt für Eich- und Vermessungswesen nos dá um bom ponto de partida para tentar gerar uma camada apropriada que segmente Salzburgo em áreas definidas por sua adequação em relação a esse critério.


Como pode ser visto neste caso, os dados de verdade básica consistem em vários polígonos correspondentes a estruturas existentes no estado de Salzburgo. Isso oferece um ponto de partida promissor, mas uma série de questões ainda precisam ser abordadas para transformar essa entrada na camada de classificação binária apropriada. Ou seja, como se faz uma distinção significativa entre uma cidade, aparecendo aqui como um aglomerado compacto de polígonos, e duas casas isoladas em um campo? Neste caso, recorremos ao algoritmo Density-Based Spatial Clusterring, que fornece uma classificação intuitiva baseada na densidade de uma área em "residencial" ou "não residencial" com base na densidade desses polígonos estruturais e seu número de vizinhos. Dessa forma, podemos obter, por exemplo, a seguinte classificação.

Identificando Regiões de Nível
Outro critério importante para qualquer projeto de construção é que o terreno tenha a inclinação adequada. De modo geral, os projetos de construção devem ser nivelados para fornecer a fundação adequada para a estrutura planejada. Acima de um determinado grau de inclinação, os custos para nivelar a área tornam-se proibitivos demais para que o projeto seja viável. Felizmente, dados raster de código aberto capturados a partir de levantamentos realizados com medições a laser estão disponíveis com resolução de 5 m.
Neste caso, como se trata de dados raster, e não vetoriais, a tradução dessa camada em uma máscara de classificação binária é um pouco mais complexa. Nesse caso, isso foi realizado definindo um ângulo limite acima do qual um ponto de interesse foi considerado "muito inclinado". Consultando os dados raster para todas essas regiões, extraindo-as para vetores com o OpenCV e limitando as áreas extraídas, chegamos à classificação desejada.

Conclusão
Após extrair com sucesso uma máscara de classificação binária para cada um dos critérios que definem a adequação de uma região para a construção de um parque eólico, a soma dos resultados é simples: basta combinar todas as máscaras de classificação em uma. As regiões resultantes são as regiões ótimas, conforme determinado pelos dados oficiais fornecidos pelo governo estadual de Salzburgo e pelo governo federal da Áustria. Uma descoberta e tanto!