Scienza dei materiali
NEMAD: il database AI di 67.573 materiali magnetici e cosa sappiamo sui 25 candidati sopra 500 K
Oggi mettiamo ordine su NEMAD: 67.573 record sperimentali di materiali magnetici estratti dalla letteratura con modelli linguistici e usati per addestrare modelli di machine learning su classificazione, Curie e Néel. Qui trovi la ricostruzione tecnica, i numeri che contano e una guida pratica per capire cosa cambia davvero quando si parla di 25 candidati sopra 500 K.
Pubblicato il: Giovedì 19 febbraio 2026 alle ore 10:05. L’articolo riflette le informazioni disponibili alla data di pubblicazione e potrebbe non includere sviluppi successivi, che possono incidere sull’inquadramento dei fatti. Eventuali aggiornamenti saranno riportati nell’Update log. In mancanza di registrazioni nell’Update log, il contenuto deve considerarsi invariato rispetto alla versione pubblicata.
Ultimo aggiornamento: Venerdì 6 marzo 2026 alle ore 09:16. L’aggiornamento può includere interventi non sostanziali (revisione formale, correzioni, impaginazione o ottimizzazioni) e non implica necessariamente modifiche ai fatti riportati. Eventuali aggiornamenti di contenuto relativi agli sviluppi della notizia sono indicati nell’Update log.
Per questa ricostruzione abbiamo lavorato su fonti primarie scientifiche e su documentazione tecnica, ricostruendo numeri chiave e implicazioni pratiche. Quando un passaggio è una deduzione ragionata, lo esplicitiamo.
Qui la notizia non è “un’altra AI che legge paper”. Il punto è più concreto. NEMAD porta in un’unica struttura dati un volume enorme di misure sperimentali sul magnetismo e lo rende addestrabile. Da quella base nascono due cose che interessano davvero chi lavora su materiali: un classificatore con accuratezza 90% e modelli che stimano temperature di transizione con errori medi nell’ordine di decine di Kelvin. Gli autori arrivano poi alla parte più operativa: applicano i modelli a una libreria esterna e tirano fuori 25 candidati ferromagnetici sopra 500 K. Noi oggi facciamo un lavoro diverso dal rumore: traduciamo quei numeri in scelte e limiti, con le implicazioni già sul tavolo.
Mappa rapida: NEMAD in quattro passaggi
| Passaggio | Cosa facciamo | Il segnale da notare | Perché cambia le cose |
|---|---|---|---|
| Il collo di bottiglia | I dati sperimentali sul magnetismo sono reali ma sparsi tra articoli e tabelle difficili da indicizzare. | Senza un database, anche il miglior modello ML resta cieco dove servirebbe di più: alte temperature e pochi esempi. | Serve una base dati ampia per distinguere intuizioni da pattern replicabili. |
| L’estrazione con LLM | Un modello linguistico legge la letteratura sperimentale e produce record strutturati, material by material. | La svolta è la struttura: i dati escono in campi coerenti, quindi diventano addestrabili e confrontabili. | Si passa dall’articolo singolo alla vista d’insieme, senza perdere il legame con la fonte. |
| I modelli ML | Sui record estratti si addestrano modelli per classificare magnetismo e stimare Curie e Néel. | Le metriche dichiarate sono abbastanza buone da rendere lo screening utile, non solo curioso. | Il database diventa un acceleratore pratico per decidere quali composti meritano un banco di misura. |
| Lo screening e i candidati | Applicando i modelli a una libreria di materiali si ottiene una short list concreta. | Emergono 25 candidati ferromagnetici sopra 500 K e 13 antiferromagnetici sopra 100 K. | Il punto non è proclamare un “nuovo magnete”, è ridurre drasticamente lo spazio delle prove. |
Tip: la tabella è scorrevole. Su mobile scorri con il dito a destra e a sinistra per vedere tutte le colonne.
Composizione, struttura e proprietà magnetiche nello stesso record, quindi finalmente confrontabili.
Gli autori riportano accuratezza 90% nel distinguere ferromagneti, antiferromagneti e non magnetici.
Una short list concreta ottenuta applicando i modelli a una libreria esterna di materiali.
Qui sotto trovi campi del database, lettura delle metriche e criteri per trasformare una previsione in misura.
Quando i dati sperimentali diventano interrogabili, la ricerca smette di andare a tentoni e inizia a scegliere dove misurare.
Ascolta il riassunto: NEMAD e i 25 candidati
Il database AI che cambia la ricerca magnetica: dai dati sparsi alla short list per l’industria.
Trasparenza: fonti e metodo
Qui abbiamo fatto una cosa semplice e rara: siamo partiti dalla fonte tecnica e abbiamo ricostruito da lì tutto il resto. Il perno è un paper peer reviewed su Nature Communications. Abbiamo poi verificato che numeri e metriche coincidano anche nella scheda bibliografica su PubMed e nella versione integrale su PubMed Central. Per l’aggancio all’attualità del 19/02/2026 abbiamo controllato la comunicazione istituzionale dell’Università del New Hampshire, ripresa anche da ScienceDaily e distribuita via EurekAlert.
La regola che abbiamo seguito è pratica: ogni valore che usiamo per ragionare deve essere rintracciabile, ripetibile e leggibile senza affidarsi a interpretazioni. Il resto è analisi: cosa significa davvero quella metrica, come si traduce in scelte sperimentali e dove, invece, è facile fraintendere.
Fonte principale: lettura integrale della pubblicazione peer reviewed e ricostruzione tecnica del workflow descritto dagli autori.
Contesto essenziale: perché NEMAD diventa una notizia adesso
I magneti non sono un dettaglio della transizione energetica, sono un collo di bottiglia. Motori elettrici, generatori, sensori, attuatori: ovunque serva densità di potenza e controllo, i materiali magnetici pesano. Il problema è che la ricerca di nuovi magneti ha un nemico silenzioso: la dispersione dei dati sperimentali.
NEMAD entra proprio lì. Invece di chiedere ai ricercatori di ricordare “quel paper di dieci anni fa” o di ricostruire a mano una tabella da un PDF, il database trasforma il pubblicato in record interrogabili. Da quel momento puoi fare due cose: capire pattern su scala ampia e addestrare modelli che ti dicono dove vale la pena misurare prima.
La promessa legata alle terre rare va letta con attenzione. Il database contiene moltissimi composti e proprio questa ampiezza rende più plausibile cercare alternative senza rimanere intrappolati nei soliti pochi sistemi chimici. Il passaggio successivo resta duro: trasformare una previsione in un campione reale con proprietà magnetiche stabili.
In breve
- NEMAD viene descritto come un database con 67.573 record sperimentali di materiali magnetici.
- Ogni record è definito da composizione, dettagli strutturali e proprietà magnetiche, con 15 campi per entry.
- Machine learning: classificazione a tre classi con accuratezza 90% e regressioni su Curie e Néel con R^2 fino a 0,87 e 0,83.
- Screening: 25 candidati ferromagnetici con Curie prevista oltre 500 K e 13 antiferromagnetici con Néel oltre 100 K.
Numeri chiave che contano davvero
Prima di perderci in interpretazioni, mettiamo sul tavolo i numeri che cambiano la scala. Sono i valori che fanno la differenza tra una curiosità e uno strumento che puoi usare in laboratorio.
| Indicatore | Valore riportato | Come lo leggiamo operativamente |
|---|---|---|
| Dimensione database | 67.573 materiali | La scala riduce l’effetto “dataset piccolo”, soprattutto nelle code ad alta temperatura. |
| Campi per record | 15 feature | Il record non è solo Curie e Néel: lega struttura e proprietà magnetiche. |
| Accuratezza classificazione | 90% | Utile come filtro iniziale tra classi magnetiche e non magnetiche. |
| Predizione Curie | R^2 0,87 e MAE 56 K | Errore medio dell’ordine di decine di Kelvin: screening, poi misura. |
| Predizione Néel | R^2 0,83 e MAE 38 K | Buona separazione per priorità sperimentali sugli antiferromagneti. |
| Candidati da screening | 25 sopra 500 K e 13 sopra 100 K | Short list concreta, interpretata come agenda di misure. |
Un punto che teniamo fermo: R^2 e MAE raccontano quanto un modello segue i dati noti, poi il mondo reale impone la verifica su campioni, fasi e purezza. Per questo leggiamo i candidati come priorità, non come prodotti.
La ricostruzione: cosa è NEMAD e perché è diverso da “un dataset in più”
Nota: da qui entriamo nel tecnico. Se lavori su materiali o R&D, questa è la parte che ti serve per usare NEMAD senza fraintendimenti.
Sommario dei contenuti
- Che cos’è NEMAD, in concreto
- Come nasce: letteratura, estrazione e standardizzazione
- Le 15 feature: cosa c’è dentro un record
- Le metriche ML: cosa significano per chi misura
- Qualità dei dati e tasso di errore
- Duplicati e variabilità dei valori
- Copertura e distribuzione delle temperature
- I 25 candidati sopra 500 K: come interpretarli
- Filtro terre rare sulla short list
- Target numerici per magneti permanenti
- Limiti e bias: dove leggere con prudenza
- Replicare pipeline e audit dei record
- Accesso e replicabilità: dove consultare NEMAD e rifare lo screening
- Feature engineering: come la composizione diventa input
- Screening esterno: perché il consenso riduce i falsi positivi
- Short list completa: 25 ferromagneti e 13 antiferromagneti
- FAQ
Che cos’è NEMAD, in concreto
NEMAD viene presentato come un database di materiali magnetici costruito estraendo automaticamente dati sperimentali dalla letteratura. La parola che fa la differenza è “sperimentali”. Gran parte della ricerca in materiali vive su misure che esistono davvero ma sono sparse: risultati in testo, tabelle con più composti, unità non uniformi, note sperimentali che cambiano l’interpretazione di un valore.
Il database viene descritto con 67.573 record e ogni record è “un materiale” definito da tre pilastri: composizione chimica, dettagli strutturali e proprietà magnetiche. Questa definizione conta perché impedisce il trucco involontario dei dataset che conosciamo: tanta quantità su pochi campi. Qui l’ambizione è più ampia: includere anche struttura e parametri magnetici utili a chi studia prestazioni, non solo temperature.
Come nasce: letteratura, estrazione e standardizzazione
La parte più sottovalutata, quando si parla di AI in scienza, è l’ingegneria del flusso. Il workflow descritto nel paper gestisce articoli con formati diversi e li porta a un testo strutturato prima dell’estrazione dei campi. Questo passaggio è ciò che ti evita la “magia” e ti consegna un dataset lavorabile.
La nostra lettura è questa: il valore pratico non sta nel fatto che un LLM legga, sta nel fatto che l’output diventi coerente. Coerente significa che una Curie in Kelvin non si mescola con una magnetizzazione in A m-1, che un DOI resta un gancio di verifica e che un record non confonde due composti presenti nella stessa tabella.
Le 15 feature: cosa c’è dentro un record
Qui arriviamo alla parte che fa lavorare davvero il database. NEMAD viene descritto con 15 campi per entry. In pratica ti dice non solo “quanto resta magnetico un materiale” ma anche come è fatto e da dove viene l’informazione.
| Campo | Unità | Che cosa rappresenta | Perché serve davvero |
|---|---|---|---|
| Material | String | Composizione chimica del composto. | È la chiave di partenza per feature engineering e confronto tra famiglie chimiche. |
| Curie | K | Temperatura di Curie. | Filtra ferromagneti stabili a temperatura elevata e orienta lo screening. |
| Néel | K | Temperatura di Néel. | È la bussola per antiferromagneti, fondamentali anche per spintronica e materiali funzionali. |
| Curie Weiss | K | Temperatura di Curie Weiss. | Aiuta a leggere interazioni magnetiche e possibili competizioni che complicano il comportamento. |
| Crystal Structure | String | Struttura cristallina. | Collega proprietà magnetiche a simmetria e organizzazione atomica. |
| Lattice Structure | String | Sistema o descrizione del reticolo. | Serve per modelli più avanzati che usano grafi e informazione strutturale. |
| Lattice Parameter | String | Parametri reticolari. | È un ponte tra struttura e proprietà, utile per confronti fini tra fasi simili. |
| Space Group | String | Gruppo spaziale. | La simmetria condiziona anisotropia e quindi anche prestazioni magnetiche. |
| Coercivity | Oe | Coercività. | Per i magneti permanenti è uno dei parametri che separa “magnetico” da “usabile”. |
| Magnetization | A m-1 | Magnetizzazione. | Ti dice quanta risposta magnetica puoi aspettarti a parità di condizioni. |
| Magnetic Moment | μB | Momento magnetico. | Utile per confrontare meccanismi microscopici e famiglie di composti. |
| Remanence | A m-1 | Remanenza. | Indica quanto magnetismo resta senza campo esterno, rilevante in applicazioni reali. |
| Susceptibility | Adimensionale | Suscettività. | Aiuta a leggere la risposta in regime lineare e a confrontare materiali “debolmente” magnetici. |
| DOI | String | Fonte del dato. | È il gancio per tornare al paper e verificare condizioni sperimentali e contesto. |
| Experimental | Boolean | Indicazione sperimentale (Yes/No) associata alla fonte. | Serve per non confondere valori misurati con valori riportati o derivati in modo non uniforme. |
Le metriche ML: cosa significano per chi misura
Gli autori riportano un risultato che oggi fa notizia perché è usabile: accuratezza 90% nella classificazione tra ferromagnetico, antiferromagnetico e non magnetico. Poi arrivano le regressioni. La migliore predizione di Curie viene riportata con R^2 0,87 e MAE 56 K. Per Néel si parla di R^2 0,83 e MAE 38 K.
Traduzione operativa. Un MAE di 56 K significa che, in media, l’errore assoluto sta nell’ordine di 56 gradi Kelvin, quindi decine di gradi Celsius come scala. Questo non uccide il progetto, lo definisce. Con quell’errore tu non compri un materiale “sicuro”, tu compri una priorità. Il valore è nella separazione: cosa ha probabilità di stare in alto e cosa quasi certamente no.
Un altro dettaglio importante riportato è l’uso di feature generate dalla composizione chimica. In termini pratici significa copertura elevata e meno campi mancanti, quindi più materiali restano addestrabili e confrontabili. Se lavori su database reali, sai che questo è un vantaggio concreto.
I 25 candidati sopra 500 K: come interpretarli senza farsi male
La frase “25 candidati sopra 500 K” è quella che fa girare la notizia. Noi la mettiamo su binari. 500 K corrispondono a circa 227 °C. È una soglia severa e ha senso perché molte applicazioni industriali soffrono il decadimento magnetico con la temperatura.
Questo però non basta per parlare di magneti permanenti “pronti”. Curie alta è un prerequisito. Poi arrivano filtri più duri: coercività, anisotropia, stabilità delle fasi, processabilità e costo. Il database contiene campi utili anche per questo, però la qualità finale la decide la misura su campione e la replicabilità.
Qui sta il punto che ci interessa come redazione: NEMAD non vende certezze, vende accelerazione. Trasforma un problema da milioni di combinazioni a un set di ipotesi che vale la pena mettere su banco.
Per chi vuole i nomi uno per uno, la tabella completa con sistemi cristallini e stime XGBoost è nella card short list completa che trovi più sotto.
Limiti e bias: dove leggere con prudenza
Ogni database costruito da letteratura porta un’impronta. Nel caso descritto, la letteratura di partenza è selezionata e questo crea un bias naturale su classi di materiali più pubblicate, più misurate o più “di moda” in certe stagioni scientifiche. Non è un difetto, è un dato di fatto da governare.
Il secondo punto è metodologico. Un LLM è forte nel trasformare testo in struttura, poi resta vulnerabile a ambiguità, unità, contesto sperimentale e tabelle dense. Il record con DOI aiuta a difendersi perché riporta il lettore alla sorgente, quindi la verifica resta possibile.
Qualità dei dati: quanto fidarsi dell’estrazione automatica
Prima di usare un database estratto da PDF noi ci facciamo sempre una domanda: quanto sbaglia davvero. Qui c’è un numero dichiarato. Gli autori hanno preso un campione casuale di 5.015 record e hanno confrontato campo per campo l’output estratto con il contenuto del paper originale usando un valutatore automatico (Gemini 2.5). Risultato: accuratezza mediana 94% sui campi estratti.
Questo non significa che ogni singolo record sia “giusto al 94%”. Significa che, guardando i campi uno per uno, la mediana dell’accuratezza è 0,94. In pratica NEMAD è ottimo per triage e per costruire set di training, poi quando un valore diventa decisionale noi risaliamo al DOI.
Dove l’errore è più probabile
- Tabelle e figure: i numeri in tabella possono “slittare” di riga o colonna durante l’estrazione.
- Unità e conversioni: Oe, kA/m, emu, A m-1, μB possono comparire in forme diverse o in notazioni miste.
- PDF scansionati: quando serve OCR aumentano i refusi (punti decimali, segni meno, simboli).
- Contesto sperimentale: lo stesso materiale può cambiare proprietà con microstruttura, trattamenti, purezza.
Checklist di verifica in 60 secondi
- Apriamo il DOI del record e cerchiamo il valore in testo o tabella.
- Controlliamo unità e condizioni di misura riportate.
- Se nel record compaiono più proprietà, verifichiamo che si riferiscano allo stesso campione.
- Annotiamo fonte e pagina: se torna tutto, allora il dato è “buono per lavorarci”.
Nota: la stima dell’accuratezza è fatta su un campione e con un valutatore automatico. Se stiamo prendendo decisioni ad alto impatto conviene validare anche a mano un micro campione del proprio subset.
Duplicati e conflitti: perché lo stesso composto può avere più Tc
NEMAD aggrega letteratura. Tradotto: la stessa formula può comparire più volte, anche con temperature diverse. Non è un bug automatico. È spesso variabilità reale tra campioni, sintesi, fasi, metodi di misura, oppure differenze di come un paper riporta i risultati.
Nel dataset usato per addestrare i modelli di regressione gli autori partono da 24.500 record con temperatura di Curie e 9.500 con temperatura di Néel. Quando più articoli riportano temperature per la stessa composizione, raggruppano per formula chimica e usano la media delle temperature di transizione. Dopo il raggruppamento restano 15.577 composti ferromagnetici unici e 7.893 antiferromagnetici unici.
Cosa implica questa scelta
- Riduce rumore: la media attenua outlier e refusi, quindi aiuta i modelli.
- Nasconde dispersione: se un composto ha Tc molto variabile tra paper, la media lo “normalizza”.
- Fasi diverse stessa formula: una composizione può esistere in più strutture e non è detto che abbiano la stessa Tc.
- Decisione pratica: per discovery va bene una stima centrale, per ingegnerizzazione serve anche capire lo spread.
Come lo usiamo noi: la media è un buon punto di partenza, poi quando un candidato entra in laboratorio vale la regola del DOI: si torna al paper e si controllano condizioni e campione.
Copertura e distribuzione: dove il database è pieno e dove è inevitabilmente bucato
Due cose sono vere nello stesso momento: NEMAD è grande e non è uniforme. Le temperature di transizione sono il dato più ricorrente perché tantissimi lavori riportano Tc o TN, mentre proprietà hard-magnet come coercività e remanenza compaiono solo quando vengono misurate e pubblicate.
Curie: come si distribuiscono i composti
Nel set ferromagnetico usato nel lavoro, 47% dei composti ha Tc sotto 300 K e 22% supera 600 K. Quello che resta cade tra 300 K e 600 K. Questa “coda alta” è il motivo per cui ha senso uno screening mirato ai valori più elevati, anche se resta una minoranza.
FM, AFM e “entrambi”: una copertura utile da sapere
Nel database riportato nel paper la ripartizione è circa 68% ferromagnetici, circa 30% antiferromagnetici e circa 2% con entrambe le transizioni (in base ai record disponibili). In un colpo d’occhio ci dice dove è più probabile trovare Tc elevate, ma anche quanto materiale AFM esiste per chi lavora su spintronica e fenomeni correlati.
Regola rapida: un campo mancante in NEMAD va letto come “non riportato” e non come “zero”. Questo dettaglio da solo evita un sacco di interpretazioni sbagliate.
Accesso e replicabilità
Se vogliamo usare NEMAD in modo operativo, il primo passo è sapere dove stanno davvero i dati. La porta d’ingresso, oggi, è nemad.org: lì il database viene reso consultabile come portale pubblico e ogni record mantiene un aggancio chiaro alla fonte tramite DOI.
La seconda cosa che interessa chi lavora in R&D è la replicabilità. Per questo teniamo d’occhio il pacchetto di riferimento rilasciato dagli autori su Zenodo con DOI 10.5281/zenodo.17042814. La versione indicata come v1.0 risulta pubblicata il 3 settembre 2025 con licenza Creative Commons Attribution 4.0. Tradotto: la pipeline di machine learning non è un racconto, è un artefatto che possiamo ispezionare e replicare.
Lettura rapida utile: NEMAD non è un dataset “da grafico” in cui l’unità di misura è scontata. Il DOI è il salvagente. Quando un valore sembra fuori scala, la verifica pratica è risalire all’articolo originale e controllare contesto sperimentale, fase e unità.
Replicare pipeline e audit dei record: cosa serve davvero
Se vogliamo essere soddisfatti al 100% non basta “leggere la lista”. Serve poterla rifare e poter controllare i record che contano. Nel materiale open source del progetto c’è una struttura semplice che rende replicabile il flusso, almeno nei passaggi chiave.
I file che contano per partire
-
Un dataset per classificazione:
Classification_FM_AFM_NM.csv(etichetta FM, AFM, NM). -
Due dataset per regressione:
FM_with_curie.csveAFM_with_Neel.csv(temperature target).
Il nostro modo pratico di replicare senza perdere giornate
- Blocchiamo un ambiente riproducibile (versioni librerie e seed fissati) e salviamo hash dei file CSV usati.
- Verifichiamo la regola “una composizione, un valore” e controlliamo come viene fatta la media quando esistono più misure.
- Ricostruiamo una run end to end e controlliamo se le metriche e i candidati rientrano nelle stesse grandezze del paper.
Correzioni: come trattiamo un record sospetto
Quando un valore sembra incoerente la procedura più pulita è sempre la stessa: si risale al DOI, si controlla unità e contesto e poi si documenta la discrepanza. Se il problema riguarda il codice o i file del pacchetto open source, il canale più pratico è aprire una issue nel repository su GitHub allegando DOI, campo, valore estratto e valore corretto con riferimento alla pagina del paper.
Perché questa card esiste: il dato “giusto” non è quello che ci piace. È quello che possiamo difendere con una fonte primaria in mano.
Feature engineering: come la composizione diventa input
Qui c’è un passaggio che spesso viene saltato, poi ci si stupisce se un modello “indovina” senza capire. La scelta tecnica è questa: rappresentare ogni materiale con un vettore di 84 dimensioni, una per ciascun elemento chimico presente nel database, usando le proporzioni atomiche. È una firma compatta che cattura sostituzioni e famiglie chimiche senza bisogno di coordinate atomiche complete.
Da quel vettore, gli autori derivano indicatori che hanno senso fisico: medie pesate di numero atomico, peso atomico, elettronegatività e momento magnetico. Aggiungono anche misure di “complessità composizionale” come la norma L2 e l’entropia di composizione, utili quando passi da composti quasi binari a formule più affollate.
C’è un dettaglio che vale oro se fai screening: calcolano anche la frazione totale di elementi tipicamente associati a Curie elevate come Fe, Co e Ni e separano la quota di terre rare. Infine, quando la struttura è disponibile, il sistema cristallino entra come one hot encoding. Questo ci dice una cosa pratica: il modello non “vede” la microstruttura, però vede abbastanza chimica più una traccia strutturale da costruire ranking sensati.
Screening esterno: consenso e riduzione dei falsi positivi
La parte che abbiamo voluto ricostruire con più cura è il ponte tra “ho un modello” e “ho un candidato credibile”. Gli autori non si limitano a prendere una lista esterna. Partono dal database Materials Project, scaricano materiali già etichettati come magnetici con informazioni utili sulla stabilità e poi rimuovono i composti già presenti in NEMAD per evitare sovrapposizioni.
Il passaggio chiave è il consenso: fanno riclassificare quei materiali dal loro modello e tengono solo i casi in cui le etichette coincidono. Da questo filtro dichiarano 602 ferromagneti e 237 antiferromagneti pronti per le regressioni di Curie e Néel. In parallelo applicano lo stesso schema a una libreria curata di Heusler e half Heusler termodinamicamente stabili provenienti da calcoli DFT ad alto throughput, anche qui ripulendo duplicati.
Per chi fa sperimentazione il messaggio è semplice: il consenso non è una formalità. È il modo più efficace per ridurre falsi positivi prima di investire tempo in sintesi e caratterizzazione.
Short list completa: candidati FM e AFM
Qui mettiamo sul tavolo la tabella che mancava per chi vuole restare autosufficiente. Riportiamo la short list dei composti evidenziati nello studio, distinguendo ferromagneti e antiferromagneti. Per restare leggibili senza gonfiare la pagina, mostriamo la stima XGBoost della temperatura di transizione come media ± deviazione standard su dieci addestramenti con semi diversi.
Ferromagneti selezionati
| Composizione | Sistema cristallino | TC prevista XGBoost (K) |
|---|---|---|
| VFeCoGe | Cubico | 500 ± 57.4 |
| RhCoGaFe | Cubico | 502.9 ± 50.1 |
| Fe3PtN* | Cubico | 535.4 ± 48.1 |
| Fe4Co3Si3 | Cubico | 552.7 ± 42.8 |
| GeFe7Co3 | Cubico | 568 ± 36.5 |
| (GaFe)3Al2Fe3 | Cubico | 578.3 ± 36.3 |
| GaFe2Co4Si | Cubico | 582.4 ± 36.9 |
| Fe3Co3Si2 | Cubico | 587.5 ± 33.7 |
| Ga3Fe6Co4Si3 | Cubico | 598.3 ± 39.3 |
| Co2MnSb* | Cubico | 599.7 ± 49.2 |
| GeFe6Co3 | Cubico | 606.7 ± 38.6 |
| Fe5Co4Si2 | Cubico | 607.2 ± 37.9 |
| GaFe4Co2Si | Cubico | 609.6 ± 35.1 |
| Fe2CuGa* | Cubico | 629 ± 48.7 |
| GaFe8Co4 | Cubico | 646.3 ± 38.9 |
| GeCrCoFe* | Cubico | 686.2 ± 36.5 |
| GaFe4Co4Si | Cubico | 723.9 ± 38.5 |
| NbAlCo2* | Esagonale | 389.1 ± 48.4 |
| Y(GaFe)6* | Esagonale | 463.7 ± 20.1 |
| Ba2FeNiO6 | Trigonale | 525.6 ± 59.7 |
| Fe2RuGe* | Tetragonale | 819.7 ± 34.4 |
| Ni3Pt2Y | Tetragonale | 826.4 ± 53.6 |
| Ga3Fe4Co8Si | Tetragonale | 966.5 ± 31.8 |
| GeFe12Co4 | Tetragonale | 971.7 ± 14.7 |
| Ga3Fe4Co8Si2 | Tetragonale | 1009.2 ± 39.9 |
L’asterisco segnala composti per cui esiste già in letteratura una temperatura di ordinamento sperimentale. Nello studio vengono riportati questi valori: Fe3PtN (642 K); Co2MnSb (600 ± 10 K); Fe2CuGa (798 K); GeCrCoFe (866 K); NbAlCo2 (383 K); Y(GaFe)6 (500 K); Fe2RuGe (860 K). Per noi sono un benchmark utile: se una parte della tabella è già misurata, capiamo subito se le stime sono nella giusta regione.
Antiferromagneti selezionati
| Composizione | Sistema cristallino | TN prevista XGBoost (K) |
|---|---|---|
| ZrCdCr2 | Trigonale | 105.4 ± 6.8 |
| FeS | Esagonale | 117.8 ± 3.9 |
| Sc4S6Fe4 | Cubico | 124.6 ± 10.4 |
| ZnFe2O4 | Cubico | 125.2 ± 1.4 |
| Fe2PbO4 | Ortorombico | 132.2 ± 4.5 |
| FePO4 | Ortorombico | 142.4 ± 1.8 |
| LiFePO4 | Ortorombico | 145.4 ± 4.8 |
| AgF2 | Ortorombico | 149.9 ± 2.4 |
| SmFeO3 | Ortorombico | 211 ± 2.8 |
| Co3O4 | Cubico | 229.2 ± 8.8 |
| Fe2O3 | Trigonale | 241.3 ± 6.1 |
| CuO | Monoclino | 249.4 ± 4 |
| LaFeO3 | Ortorombico | 262.7 ± 3.9 |
Nota di lettura: lo studio segnala che nella regione di Curie molto alta i modelli tendono a sottostimare sul dataset originale e questo viene interpretato come bisogno di più dati ad alta temperatura. In pratica, qui la cifra più utile è l’ordine di grandezza e la coerenza tra modelli più che il singolo Kelvin.
Filtro terre rare: quali candidati dipendono da Sc, Y o lantanidi
Per diversi lettori la domanda è molto concreta: quanti candidati richiedono elementi delle terre rare. Qui usiamo una definizione standard che include scandio, ittrio e lantanidi.
| Lista | Composto | Elemento RE |
|---|---|---|
| FM | Y(GaFe)6 | Y |
| FM | Ni3Pt2Y | Y |
| AFM | Sc4S6Fe4 | Sc |
| AFM | LaFeO3 | La |
| AFM | SmFeO3 | Sm |
Il resto della short list, per costruzione, non contiene terre rare secondo questa definizione. Attenzione però: RE free non significa automaticamente “economico” o “facile”, perché diversi candidati includono elementi costosi o critici (per esempio Pt e Rh).
Come lo usiamo noi: il filtro RE è un criterio di industrializzazione, non un criterio di fisica. Va applicato dopo aver capito cosa stiamo cercando e perché.
Dal Tc al magnete vero: target numerici per Br, Hcj e BHmax
Uno screening su Tc è un filtro potente ma non basta per dire “questo diventa un magnete”. Un magnete permanente utile richiede almeno tre numeri da tenere d’occhio: remanenza (Br), coercività intrinseca (Hcj) e prodotto energetico massimo (BHmax). Senza questi, Tc alto resta un indizio e non una specifica.
Esempi di minimi per NdFeB in una codifica IEC
Per dare un ordine di grandezza, in una tabella divulgativa basata su IEC 60404-8-1 (riportata da MPCO Magnetics) compaiono esempi con questi valori minimi a temperatura ambiente:
| Esempio grado | Br min (mT) | Hcj min (kA/m) | BHmax min (kJ/m³) | BHmax min (MGOe) |
|---|---|---|---|---|
| 170/190 | 980 | 1900 | 170 | 21,4 |
| 290/80 | 1230 | 800 | 290 | 36,4 |
Questi esempi servono per capire le scale: Br nell’ordine del tesla e coercività intrinseca nell’ordine di centinaia o migliaia di kA/m per magneti ad alte prestazioni. In parallelo, la Magnetic Materials Producers Association usa da anni la notazione in MGOe per comunicare rapidamente BHmax nelle schede materiali.
Temperatura di esercizio: non confondere Tc con “quanto regge”
Per scegliere una famiglia magnetica in funzione della temperatura, una guida applicativa di Arnold Magnetic Technologies riassume che NdFeB è tipicamente preferibile fino a circa 150°C, mentre SmCo copre in modo più robusto fasce più alte (nell’ordine di 180°C fino a 350°C, con gradi speciali ancora oltre). È un promemoria utile: Tc alto aiuta, ma la tenuta di coercività con la temperatura è spesso il collo di bottiglia.
Messaggio chiave: la short list NEMAD è un invito a misurare. Il salto “da Tc alto a magnete” passa da anisotropia, microstruttura e processo, non solo da un numero.
Fatti verificati e deduzioni della redazione
Per chi vuole chiudere la pagina senza dubbi, qui separiamo ciò che è consolidato dai dati da ciò che è una nostra lettura tecnica. È il modo più pulito per non confondere performance ML con prestazione magnetica reale.
Fatti verificati
- NEMAD viene descritto con 67.573 record e 15 campi che includono composizione più struttura e proprietà magnetiche.
- Nel database la distribuzione dichiarata è 68% ferromagneti, 30% antiferromagneti e circa 2% con entrambe le etichette.
- Lo screening esterno basato su consenso produce 602 ferromagneti e 237 antiferromagneti su cui vengono applicate le regressioni.
- La tabella della short list include 25 composti ferromagnetici e 13 antiferromagnetici con stime riportate come media ± deviazione standard.
Deduzioni utili
- La short list va trattata come agenda sperimentale: una Curie alta da sola non garantisce un magnete permanente competitivo perché mancano anisotropia, microstruttura e stabilità in esercizio.
- Molti candidati ferromagnetici sono dominati da metalli di transizione e questo suggerisce una ricerca di sistemi a basso contenuto di terre rare, anche se la lista non è esclusivamente rare earth free.
- Il filtro di consenso è la scelta che più abbassa il rumore per chi sintetizza: meno tempo perso su falsi positivi, più energia su verifiche mirate.
- Nei materiali ad altissima Curie ha più valore la coerenza tra modelli che il singolo numero, quindi conviene usare la tabella come ranking e non come specifica.
Guida pratica: dal database alla misura, senza sprechi
Se devi scegliere cosa misurare domani mattina
Questo è l’uso più concreto di NEMAD. Non partire dall’hype, parti da un protocollo. I modelli ti consegnano candidati e stime, poi serve una sequenza di controlli che trasformi la previsione in risultato.
Un percorso di lavoro che regge
- Step 1: seleziona per soglia (Curie o Néel) e fai subito un controllo sulla composizione, pensando già a costo e disponibilità degli elementi.
- Step 2: vai al DOI e verifica condizioni sperimentali, purezza del campione e presenza di più fasi.
- Step 3: controlla struttura e simmetria, perché anisotropia e stabilità microstrutturale passano da lì.
- Step 4: pianifica misure magnetiche con un obiettivo chiaro: distinguere transizione, coercività e perdita con temperatura.
- Step 5: se il materiale regge, solo allora ha senso parlare di processo e scalabilità.
Un errore comune è confondere “alto TC” con “alto valore industriale”. Il valore industriale arriva quando il comportamento resta stabile con temperatura e con cicli, non quando un numero è grande da solo.
La lettura della redazione: perché questa volta non è una promessa vaga
Noi su queste storie abbiamo un radar. Molte “AI per i materiali” si fermano al claim, qui invece c’è un oggetto operativo: un database con campi strutturali e proprietà magnetiche, un set di modelli dichiarati e una short list ottenuta da screening. Sono tre livelli che, messi insieme, fanno la differenza.
Il punto più forte, dal nostro lato, è la trasformazione del lavoro quotidiano. Un ricercatore non ha bisogno che un modello gli dica “questo è interessante” con tono oracolare. Ha bisogno di un filtro che riduca il rumore e di un percorso che resti verificabile. Il DOI dentro il record è la scelta che tiene in piedi l’affidabilità del sistema, perché ti riporta sempre alla fonte.
La parte delicata è una sola: l’interpretazione pubblica. Dire “25 candidati” è corretto, poi va aggiunto cosa manca per parlare di magnete permanente competitivo. Se quel passaggio viene saltato, si crea aspettativa sbagliata. Se viene spiegato bene, NEMAD diventa un acceleratore reale per la ricerca di materiali magnetici alternativi e per l’ottimizzazione di quelli già noti.
Questa è una lettura editoriale: interpreta i numeri e i meccanismi descritti dagli autori e li traduce in implicazioni pratiche per chi lavora su materiali.
A cura di Junior Cristarella.
Glossario rapido per leggere NEMAD senza inciampi
Alcuni termini sembrano familiari, poi ti tradiscono quando devi decidere cosa misurare. Li fissiamo qui in modo operativo.
- Temperatura di Curie (TC): soglia sopra la quale un ferromagnete perde l’ordine magnetico spontaneo.
- Temperatura di Néel (TN): soglia analoga per gli antiferromagneti, con ordine magnetico opposto tra sottoreticoli.
- Curie Weiss (θ): parametro legato al comportamento della suscettività, utile per leggere interazioni e competizione.
- Coercività: misura della resistenza alla smagnetizzazione, centrale per magneti permanenti.
- Remanenza: magnetismo residuo a campo esterno nullo dopo magnetizzazione.
- Br: notazione comune per la remanenza. È il valore “residuo” del campo nel magnete dopo aver rimosso il campo esterno.
- Hcj: coercività intrinseca. È più informativa della coercività “B” quando ragioniamo su stabilità del magnete contro smagnetizzazione.
- BHmax: prodotto energetico massimo. È una metrica pratica per confrontare famiglie e gradi di magneti permanenti.
- MGOe: unità tradizionale usata in schede materiali per BHmax (spesso riportata accanto a kJ/m³).
Domande frequenti
Questo articolo è aggiornato al 19/02/2026?
Sì. La ricostruzione e il contesto sono allineati allo stato delle informazioni disponibili alla mattina del 19/02/2026 e gli eventuali interventi sostanziali sono tracciati nell’Update log.
Che cos’è NEMAD, in una frase?
È un database di materiali magnetici costruito estraendo automaticamente dati sperimentali dalla letteratura scientifica e organizzandoli in record strutturati utili per analisi e machine learning.
Quanti materiali contiene e perché quel numero è importante?
Il database viene descritto con 67.573 record. È importante perché la scala riduce il rischio di modelli addestrati su campioni troppo piccoli, soprattutto nelle regioni ad alta temperatura.
Che cosa significa “25 candidati sopra 500 K”?
Significa che, applicando i modelli a una libreria esterna di materiali, gli autori ottengono 25 composti ferromagnetici la cui temperatura di Curie prevista supera 500 K. È una lista di priorità sperimentali, non un certificato di prestazione industriale.
500 K a quanti gradi corrispondono?
In scala Celsius 500 K corrispondono a circa 227 °C, perché si sottraggono 273,15 gradi. La soglia è interessante perché impone margine rispetto a condizioni operative severe.
Curie alta basta per un magnete permanente da veicolo elettrico?
No. Curie alta aiuta a mantenere l’ordine magnetico alle alte temperature, poi servono coercività, anisotropia magnetica, densità di energia, stabilità delle fasi e una microstruttura che regga il ciclo termico.
Come devo leggere una MAE di 56 K?
Come un errore medio assoluto sulla temperatura: in media la previsione può scostarsi di decine di Kelvin. In screening è utile perché separa gruppi promettenti da gruppi improbabili, poi la misura decide.
Dove sta il rischio più grande in un database estratto con LLM?
Nei dettagli: unità, colonne di tabelle con più materiali, nomenclatura dei composti, conversioni implicite e ambiguità tra valori misurati e valori derivati. Per questo il legame al DOI e la verifica puntuale restano centrali.
Che cosa cambia da oggi per chi fa ricerca o R&D?
Cambia la velocità del primo filtro. Invece di partire da conferme aneddotiche o da ricerche per parole chiave, si parte da record strutturati e da modelli che riducono l’area delle prove a ciò che ha più probabilità di reggere in laboratorio.
Timeline tecnica: apri le fasi in ordine
Tocca una fase per vedere i passaggi chiave. La timeline serve a orientarti anche se vuoi usare NEMAD come strumento di lavoro.
-
Fase 1 Il problema reale: dati sperimentali dispersi e poco addestrabili
- La fisica del magnetismo è misurabile ma spesso resta intrappolata in PDF e tabelle.
- Le banche dati curate a mano hanno valore ma soffrono di scala e copertura.
- L’alta temperatura è un punto critico perché gli esempi utili sono meno numerosi.
- Senza massa critica, i modelli ML tendono a generalizzare male proprio dove servirebbero di più.
Perché conta: NEMAD nasce per trasformare la conoscenza pubblicata in un dataset con cui si può lavorare davvero.
-
Fase 2 Dalla letteratura al testo strutturato: gestire formati diversi senza perdere informazione
- Il workflow descritto dagli autori gestisce articoli in XML e PDF standard.
- I documenti più vecchi o scannerizzati richiedono un passaggio OCR di qualità.
- Il punto delicato è la fedeltà: estrarre bene numeri, unità e materiali quando nella stessa tabella convivono più composti.
Perché conta: Se sbagli qui, l’errore si propaga e diventa “dato”. La robustezza sta nel normalizzare prima di addestrare.
-
Fase 3 Il record NEMAD: quindici campi che rendono confrontabili materiali diversi
- Ogni entry lega composizione, temperature di transizione, struttura e proprietà magnetiche.
- Il record resta agganciato alla fonte tramite DOI, così la verifica rimane possibile.
Perché conta: Un dataset utile non è solo grande, deve essere interrogabile e verificabile senza fatica.
-
Fase 4 Addestramento ML: classificare il magnetismo e prevedere Curie e Néel
- Gli autori riportano un modello di classificazione a tre classi con accuratezza 90%.
- Per Curie e Néel vengono riportate prestazioni in termini di R^2 e errore assoluto medio.
- La scelta di feature basate sulla composizione è una decisione pragmatica: alta copertura, pochi missing.
- Le metriche contano solo se sai leggerle come “filtro”, non come sentenza.
Perché conta: Il valore pratico sta nel creare una priorità sperimentale, non nel sostituire la misura.
-
Fase 5 Screening: dai milioni di possibilità a una lista che puoi misurare
- Lo screening applica i modelli a una libreria esterna già nota in ambito materiali.
- Il risultato è una short list con soglie chiare sulle temperature di transizione.
- La soglia 500 K ha un significato industriale perché impone margine rispetto a condizioni operative severe.
- Il punto decisivo resta la verifica in laboratorio con campioni reali e controllo delle fasi.
Perché conta: Una previsione buona accelera, una previsione non verificata illude. La differenza la fa il protocollo sperimentale.
-
Fase 6 Dal candidato al magnete: cosa serve per parlare di prestazioni e non solo di temperatura
- Curie alta è necessaria ma non basta per un magnete permanente competitivo.
- Servono parametri magnetici dinamici e stabilità microstrutturale al crescere della temperatura.
- Costi, reperibilità degli elementi e processabilità industriale diventano filtri duri.
- Il database aiuta a partire meglio, la qualifica chiude il cerchio.
Perché conta: NEMAD riduce l’incertezza iniziale, poi la realtà materiale decide.
Chiusura
NEMAD mette una cosa in chiaro: la scoperta nei materiali non avanza solo con intuizioni, avanza con dati che diventano lavorabili. Il database offre scala, struttura e un aggancio verificabile alla fonte. I modelli ML e i 25 candidati sopra 500 K sono il pezzo che fa notizia, poi c’è la parte che conta per davvero: trasformare quelle priorità in misure, campioni e protocolli replicabili. Se leggiamo così questa storia, il salto non è “l’AI trova il magnete”, è “la ricerca riduce sprechi e accelera dove ha senso”.
Approfondimenti correlati
Scienza: analisi e approfondimenti
Il nostro hub di scienza: AI, ricerca, tecnologia e innovazione con ricostruzioni tecniche e contesto utile.
Apri la pagina hubUpdate log
Registro degli aggiornamenti sostanziali: trasparenza su modifiche, correzioni e integrazioni informative.
- Giovedì 19 febbraio 2026 alle ore 10:10: Pubblicazione: ricostruzione tecnica di NEMAD, numeri chiave e implicazioni concrete per la ricerca di materiali magnetici ad alta temperatura.
- Giovedì 19 febbraio 2026 alle ore 10:27: Aggiunta la tabella delle 15 feature del database e una guida pratica per leggere Curie, Néel e Curie Weiss senza fraintendimenti.
- Giovedì 19 febbraio 2026 alle ore 10:43: Rafforzata la sezione “Dal candidato al magnete” con criteri sperimentali e rischi tipici dei falsi positivi nella selezione AI.
- Giovedì 19 febbraio 2026 alle ore 10:52: Inserite le card di approfondimento su accesso ai dati, feature engineering, screening esterno e tabella completa della short list (25 FM e 13 AFM) con nota sugli asterischi.
- Giovedì 19 febbraio 2026 alle ore 10:59: Aggiornate FAQ e timeline per chi usa NEMAD in R&D e vuole capire cosa cambia davvero dopo l’identificazione dei 25 candidati sopra 500 K.