The master’s thesis is situated within the field of Data Science as an emerging epistemological paradigm in an age of informational chaos. Its main objective is to build a theoretical bridge between computer science and the natural sciences, in order to understand whether Data Science represents merely a set of computational techniques or a new scientific theory about data. The thesis adopts a mode of reasoning common to the great scientists of the past, placing doubt at the center of the discussion and seeking a constant interplay between science and philosophy, while always remaining within a rigorous methodological framework. Starting from the theories of information formalized by Claude Shannon and Luciano Floridi, the theoretical foundations of the discipline are addressed by defining the concepts of data, information, observation, and validation metric. An attempt was made to develop a minimal logical foundation underlying this discipline, drawing from artificial intelligence, neuroscience, neuroethology, and with some references to botany. Particular attention was devoted to the concept of validation metrics through the ideas of neuroscientist Daniel Bor, according to whom the “relevance” of information depends on the context in which it is processed, drawing on Darwin’s theory of evolution. Through a symbolic linguistic translation, the thesis argues that Data Science is not based solely on processing large amounts of data or calculating probabilities, but on constructing validation metrics capable of building more relevant “models of the world”. The results show that within the current theoretical framework there are vague and poorly defined concepts, despite the fact that both the inorganic and organic worlds share the same universal limits in constructing information. In light of recent attempts to merge mechanical devices with organic materials, it will be necessary in the coming decades to devote significant attention to this science and to outline a new theoretical framework consistent with current scientific progress.
La tesi magistrale si inserisce nell’ambito della Data Science come paradigma epistemologico emergente in un’epoca di caos informativo. L’obiettivo principale è costruire un ponte teorico tra le scienze informatiche e quelle naturali, al fine di comprendere se la Data Science rappresenti solamente un semplice insieme di tecniche computazionali o una nuova teoria scientifica sui dati. Si è ripreso un modo di ragionare comune ai grandi scienziati del passato mettendo il dubbio come elemento centrale durante la trattazione e cercando un costante intreccio tra scienza e filosofia, rimanendo sempre in un quadro metodologico rigoroso. Partendo dalle teorie sull’informazione formalizzate da Claude Edward Shannon e Luciano Floridi, si affrontano i fondamenti teorici della disciplina definendo i concetti di dato, informazione, osservazione e metrica di validazione. Si è tentato di sviluppare una minima base logica sottostante a questa disciplina, desumendola dall’intelligenza artificiale, neuroscienze, neuroetologia e qualche rimando alla botanica. Si è dedicata molta attenzione al concetto di metrica di validazione tramite le idee del neuroscienziato Daniel Bor, secondo cui la “rilevanza” di un’informazione dipende dal contesto in cui viene elaborata riprendendo la teoria dell’evoluzione di Darwin. Operando una simbolica traduzione linguistica, la tesi sostiene che la Scienza dei Dati non si basa soltanto sull’elaborare molti dati o calcolare probabilità, ma nel costruire metriche di validazione capaci di costruire “modelli del mondo” più rilevanti. I risultati mostrano che nell’impianto teorico attuale esistono definizioni vaghe e non ben definite, nonostante il mondo inorganico e quello organico presentino alla base gli stessi limiti universali nel costruire informazioni. In seguito ai recenti tentativi di fusione tra dispositivi meccanici e materiali organici, sarà necessario nei prossimi decenni porre molta attenzione a questa scienza e delineare un nuovo impianto teorico che sia coerente con l’attuale progresso scientifico.
La scienza dei dati e la validazione dell'informazione nell'era del caos informativo
TIARI, LORENZO
2024/2025
Abstract
The master’s thesis is situated within the field of Data Science as an emerging epistemological paradigm in an age of informational chaos. Its main objective is to build a theoretical bridge between computer science and the natural sciences, in order to understand whether Data Science represents merely a set of computational techniques or a new scientific theory about data. The thesis adopts a mode of reasoning common to the great scientists of the past, placing doubt at the center of the discussion and seeking a constant interplay between science and philosophy, while always remaining within a rigorous methodological framework. Starting from the theories of information formalized by Claude Shannon and Luciano Floridi, the theoretical foundations of the discipline are addressed by defining the concepts of data, information, observation, and validation metric. An attempt was made to develop a minimal logical foundation underlying this discipline, drawing from artificial intelligence, neuroscience, neuroethology, and with some references to botany. Particular attention was devoted to the concept of validation metrics through the ideas of neuroscientist Daniel Bor, according to whom the “relevance” of information depends on the context in which it is processed, drawing on Darwin’s theory of evolution. Through a symbolic linguistic translation, the thesis argues that Data Science is not based solely on processing large amounts of data or calculating probabilities, but on constructing validation metrics capable of building more relevant “models of the world”. The results show that within the current theoretical framework there are vague and poorly defined concepts, despite the fact that both the inorganic and organic worlds share the same universal limits in constructing information. In light of recent attempts to merge mechanical devices with organic materials, it will be necessary in the coming decades to devote significant attention to this science and to outline a new theoretical framework consistent with current scientific progress.| File | Dimensione | Formato | |
|---|---|---|---|
|
Tiari Lorenzo La scienza dei dati e la validazione dell'informazione nell'era del caos informativo.pdf
accesso aperto
Descrizione: La tesi magistrale si inserisce nell'ambito della Data Science tentando di costruire un ponte tra le discipline informatiche e quelle naturali. In particolare, vengono analizzati i concetti di dato, informazione, osservazione e metrica di validazione.
Dimensione
1.58 MB
Formato
Adobe PDF
|
1.58 MB | Adobe PDF | Visualizza/Apri |
È consentito all'utente scaricare e condividere i documenti disponibili a testo pieno in UNITESI UNIPV nel rispetto della licenza Creative Commons del tipo CC BY NC ND.
Per maggiori informazioni e per verifiche sull'eventuale disponibilità del file scrivere a: [email protected].
https://hdl.handle.net/20.500.14239/34727