Re: DNA Storage

Vou partilhar aqui uma série de artigos sobre tema memorias não voláteis que para os interessados em investir longo prazo podem ser interessantes. A Samsung, Toshiba e Intel parecem ser as referências no state of art.
White paper da Samsung que expoem o caminho seguido pela indústria nos últimos anos.
Como se pode ver as escalas a que se trabalham na actualidade para cada célula é na ordem do 1nm, suponho que se refiram a diâmetro, vide representação esquemática da tech e evolução do paradigma no que toca a memória não volátil (flash/nand/ssd).
Mas reparem que existe grande preocupação não só em armazenar a maior quantidade possível mas também toda a envolvente que é rapidez de acesso e fiabilidade do sistema.
Para a Samsung também existe um problema de custos associados que tornam a tech de 1nm inviável.
Num segundo artigo refere outra tech que está também a dar os primeiros passos em que permite transístores de vários níveis. Ou seja em vez da tradicional correspondência de 1 transístor 1 bit podemos ter 1 transístor 3bit. Seria como ter 8 nucleóides diferentes no ADN.
A tech TLC pode não ser o limite. Por cada estado adicional a capacidade aumenta exponencialmente.
Na actualidade já existe um SSD comercial de 100TB. O SSD de 1PB eventualmente chegara ao mercado num espaço de poucos anos. O grande desafio é alinhar camadas de transístores durante o fabrico massivo, basta pensar na complexidade de sobrepor biliões de transístores com uma margem erro de poucos nanómetros.
Claro que uma coisa é fazer estes novos discos em laboratório, outra coisa é em produção e disponíveis comercialmente. Pensem que realmente o consumidor privado não tem sequer grande necessidade de ter um disco com mais de 1TB, principalmente com a disponibilidade do cloud que existe na actualidade. E isso pode ser um dos grandes entraves ao desenvolvimento das techs de armazenamento não volátil.
Neste terceiro artigorefere outras possíveis techs.
Neste terceiro artigo também se faz referência à alternativa da intel, que deixou de estar no mercado não empresarial porque simplesmente era demasiado cara para competir com o SSD tradicional, mas para as empresas em sectores nicho tem características muito interessantes.
A minha opinião no assunto é:
Seria possível emular a capacidade de armazenamento do ADN em com as techs actuais num exercício meramente proof of concept em laboratório? Tudo aponta a que se poderia alcançar algo similar numa escala que talvez não fosse inferior a uma única ordem de grandeza.
Terá o ADN algum espaço como tech de armazenamento de dados não voláteis? Talvez para coisas muitos especializadas como arquivo de dados por longos períodos de tempo. Nisso não parece existir qualquer dúvida que o ADN é uma molécula extremamente estável e por isso com boas características para ser ideal para guardar dados durante milhares de anos. Além disso tem a grande vantagem que uma vez guardados os dados não precisam qualquer fonte de energia para persistir os dados indefinidamente.
Qual a grande limitação do ADN? Provavelmente nunca será possível um random access que seja comercialmente interessante para ser usado no dia a dia. Ou seja a leitura e escrita de ADN deve ser sempre um processo extremamente moroso dentro daquilo que é aceitável em termos computacionais. Também tem a problemática de erros de leitura e escrita que será difícil de abordar.
Têm algum sentido alegações das memórias não voláteis baseadas em ADN serem uma tecnologia disruptiva? Não. Não me parece que seja sequer comparável, não vão substituir nem vão armazenar os dados de data centers. Não é uma tecnologia revolucionária e não é ordens de magnitude superior ao que existe actualmente, porque como disse poderia atingir algo similar com NANDs mas que não teria nenhum uso pratico. Seriam células com bits de difícil leitura tal como o ADN é neste momento, ou seja inúteis para qualquer uso prático.
São importantes estes estudos de ADN? Obviamente que sim, devemos assimilar toda a informação possível de manipular ADN, sendo sempre um conhecimento com imenso potencial para a biologia e para a medicina.
Vale a pena investir numa empresa dedica a esta tech? Pelo uso do ADN como memoria não volátil acho que não porque mesmo que seja viável comercialmente provavelmente vai ser sempre um tech especializada de nicho. Mas nunca se sabe, existem muitos outros potenciais de uma tech capaz de manipular sagazmente leitura e escrita de ADN.
White paper da Samsung que expoem o caminho seguido pela indústria nos últimos anos.
Como se pode ver as escalas a que se trabalham na actualidade para cada célula é na ordem do 1nm, suponho que se refiram a diâmetro, vide representação esquemática da tech e evolução do paradigma no que toca a memória não volátil (flash/nand/ssd).
Manufacturers strive to shrink cells to fit more
cells in less space. In 15 years cell size has gone from 120 nm
to 19 nm with 100 times more capacity. Today, cell size has
reached 1x nm.
Mas reparem que existe grande preocupação não só em armazenar a maior quantidade possível mas também toda a envolvente que é rapidez de acesso e fiabilidade do sistema.
When a cell
size goes below 20 nm, the chance for interference drastically
increases thereby making it unreliable.
Para a Samsung também existe um problema de custos associados que tornam a tech de 1nm inviável.
With a 1x nm
sized cell, light is unable to penetrate the mask. Alternatively,
effective shorter wavelength light equipment is cost prohibitive.
Num segundo artigo refere outra tech que está também a dar os primeiros passos em que permite transístores de vários níveis. Ou seja em vez da tradicional correspondência de 1 transístor 1 bit podemos ter 1 transístor 3bit. Seria como ter 8 nucleóides diferentes no ADN.
A triple level cell, remember, has the ability to cram three bits of data in each cell, using a transistor that can store eight different charge levels. Because it can store more data in the same number of cells, TLC is very much cheaper per gigabyte than SLC (and cheaper than MLC), and it also enables more storage capacity to be built into a given space: it provides much higher storage density.
A tech TLC pode não ser o limite. Por cada estado adicional a capacidade aumenta exponencialmente.
Na actualidade já existe um SSD comercial de 100TB. O SSD de 1PB eventualmente chegara ao mercado num espaço de poucos anos. O grande desafio é alinhar camadas de transístores durante o fabrico massivo, basta pensar na complexidade de sobrepor biliões de transístores com uma margem erro de poucos nanómetros.
An obvious question then is what the limit is for high capacity SSDs? Samsung’s 32TB high capacity SSD is not slated for release before next year, but the company and its rivals are bound to be working on even high capacity products.
At the moment it is proving very hard to make NAND chips with more than 64 layers, but it seems inevitable that 96 and even 128 layer chips will be feasible sooner or later, once manufacturing techniques develop. For example Toshiba has talked about “super stacking” technology, which can stack more than 100 layers.
The 32-layer
stacks of cells are connected to over 2 billion channel holes that
have been etched from the top layer of the NAND to the bottom.
From a top-down view, the entirety of these holes can be seen
on a 128 GB NAND chip that is the size a fingernail.
Claro que uma coisa é fazer estes novos discos em laboratório, outra coisa é em produção e disponíveis comercialmente. Pensem que realmente o consumidor privado não tem sequer grande necessidade de ter um disco com mais de 1TB, principalmente com a disponibilidade do cloud que existe na actualidade. E isso pode ser um dos grandes entraves ao desenvolvimento das techs de armazenamento não volátil.
Neste terceiro artigorefere outras possíveis techs.
Thus far, SSD manufacturers have delivered better performance by offering faster data standards, more bandwidth, and more channels per controller — plus the use of SLC caches we mentioned earlier. Nonetheless, in the long run, it’s assumed NAND will be replaced by something else.
What that something else will look like is still open for debate. Both magnetic RAM and phase change memory have presented themselves as candidates, though both technologies are still in early stages and must overcome significant challenges to actually compete as a replacement to NAND. Whether consumers would notice the difference is an open question. If you’ve upgraded from NAND to an SSD and then upgraded to a faster SSD, you’re likely aware the gap between HDDs and SSDs is much larger than the SSD-to-SSD gap, even when upgrading from a relatively modest drive. Improving access times from milliseconds to microseconds matters a great deal, but improving them from microseconds to nanoseconds might fall below what humans can really perceive in most cases.
Neste terceiro artigo também se faz referência à alternativa da intel, que deixou de estar no mercado não empresarial porque simplesmente era demasiado cara para competir com o SSD tradicional, mas para as empresas em sectores nicho tem características muito interessantes.
From 2017 through early 2021, Intel offered its Optane memory as an alternative for NAND flash in the consumer market. In early 2021, the company announced it would no longer sell Optane drives in the consumer space, except for the H20 hybrid drive. H20 combines QLC NAND with an Optane cache to boost overall performance while reducing drive cost. While the H20 is an interesting and unique product, it doesn’t offer the same kind of top-end performance Optane SSDs did.
Optane will remain in-market in the enterprise server segment. While its reach is limited, it’s still the closest thing to a challenger that NAND has. Optane SSDs don’t use NAND — they’re built using non-volatile memory believed to be implemented similarly to phase-change RAM — but they offer similar sequential performance to current NAND flash drives, albeit with better performance at low drive queues. Drive latency is also roughly half of NAND flash (10 microseconds, versus 20) and vastly higher endurance (30 full drive-writes per day, compared with 10 full drive writes per day for a high-end Intel SSD).
A minha opinião no assunto é:





