DNA Storage
Re: DNA Storage
Vou partilhar aqui uma série de artigos sobre tema memorias não voláteis que para os interessados em investir longo prazo podem ser interessantes. A Samsung, Toshiba e Intel parecem ser as referências no state of art.
White paper da Samsung que expoem o caminho seguido pela indústria nos últimos anos.
Como se pode ver as escalas a que se trabalham na actualidade para cada célula é na ordem do 1nm, suponho que se refiram a diâmetro, vide representação esquemática da tech e evolução do paradigma no que toca a memória não volátil (flash/nand/ssd).
Mas reparem que existe grande preocupação não só em armazenar a maior quantidade possível mas também toda a envolvente que é rapidez de acesso e fiabilidade do sistema.
Para a Samsung também existe um problema de custos associados que tornam a tech de 1nm inviável.
Num segundo artigo refere outra tech que está também a dar os primeiros passos em que permite transístores de vários níveis. Ou seja em vez da tradicional correspondência de 1 transístor 1 bit podemos ter 1 transístor 3bit. Seria como ter 8 nucleóides diferentes no ADN.
A tech TLC pode não ser o limite. Por cada estado adicional a capacidade aumenta exponencialmente.
Na actualidade já existe um SSD comercial de 100TB. O SSD de 1PB eventualmente chegara ao mercado num espaço de poucos anos. O grande desafio é alinhar camadas de transístores durante o fabrico massivo, basta pensar na complexidade de sobrepor biliões de transístores com uma margem erro de poucos nanómetros.
Claro que uma coisa é fazer estes novos discos em laboratório, outra coisa é em produção e disponíveis comercialmente. Pensem que realmente o consumidor privado não tem sequer grande necessidade de ter um disco com mais de 1TB, principalmente com a disponibilidade do cloud que existe na actualidade. E isso pode ser um dos grandes entraves ao desenvolvimento das techs de armazenamento não volátil.
Neste terceiro artigorefere outras possíveis techs.
Neste terceiro artigo também se faz referência à alternativa da intel, que deixou de estar no mercado não empresarial porque simplesmente era demasiado cara para competir com o SSD tradicional, mas para as empresas em sectores nicho tem características muito interessantes.
A minha opinião no assunto é:
Seria possível emular a capacidade de armazenamento do ADN em com as techs actuais num exercício meramente proof of concept em laboratório? Tudo aponta a que se poderia alcançar algo similar numa escala que talvez não fosse inferior a uma única ordem de grandeza.
Terá o ADN algum espaço como tech de armazenamento de dados não voláteis? Talvez para coisas muitos especializadas como arquivo de dados por longos períodos de tempo. Nisso não parece existir qualquer dúvida que o ADN é uma molécula extremamente estável e por isso com boas características para ser ideal para guardar dados durante milhares de anos. Além disso tem a grande vantagem que uma vez guardados os dados não precisam qualquer fonte de energia para persistir os dados indefinidamente.
Qual a grande limitação do ADN? Provavelmente nunca será possível um random access que seja comercialmente interessante para ser usado no dia a dia. Ou seja a leitura e escrita de ADN deve ser sempre um processo extremamente moroso dentro daquilo que é aceitável em termos computacionais. Também tem a problemática de erros de leitura e escrita que será difícil de abordar.
Têm algum sentido alegações das memórias não voláteis baseadas em ADN serem uma tecnologia disruptiva? Não. Não me parece que seja sequer comparável, não vão substituir nem vão armazenar os dados de data centers. Não é uma tecnologia revolucionária e não é ordens de magnitude superior ao que existe actualmente, porque como disse poderia atingir algo similar com NANDs mas que não teria nenhum uso pratico. Seriam células com bits de difícil leitura tal como o ADN é neste momento, ou seja inúteis para qualquer uso prático.
São importantes estes estudos de ADN? Obviamente que sim, devemos assimilar toda a informação possível de manipular ADN, sendo sempre um conhecimento com imenso potencial para a biologia e para a medicina.
Vale a pena investir numa empresa dedica a esta tech? Pelo uso do ADN como memoria não volátil acho que não porque mesmo que seja viável comercialmente provavelmente vai ser sempre um tech especializada de nicho. Mas nunca se sabe, existem muitos outros potenciais de uma tech capaz de manipular sagazmente leitura e escrita de ADN.
White paper da Samsung que expoem o caminho seguido pela indústria nos últimos anos.
Como se pode ver as escalas a que se trabalham na actualidade para cada célula é na ordem do 1nm, suponho que se refiram a diâmetro, vide representação esquemática da tech e evolução do paradigma no que toca a memória não volátil (flash/nand/ssd).
Manufacturers strive to shrink cells to fit more
cells in less space. In 15 years cell size has gone from 120 nm
to 19 nm with 100 times more capacity. Today, cell size has
reached 1x nm.
Mas reparem que existe grande preocupação não só em armazenar a maior quantidade possível mas também toda a envolvente que é rapidez de acesso e fiabilidade do sistema.
When a cell
size goes below 20 nm, the chance for interference drastically
increases thereby making it unreliable.
Para a Samsung também existe um problema de custos associados que tornam a tech de 1nm inviável.
With a 1x nm
sized cell, light is unable to penetrate the mask. Alternatively,
effective shorter wavelength light equipment is cost prohibitive.
Num segundo artigo refere outra tech que está também a dar os primeiros passos em que permite transístores de vários níveis. Ou seja em vez da tradicional correspondência de 1 transístor 1 bit podemos ter 1 transístor 3bit. Seria como ter 8 nucleóides diferentes no ADN.
A triple level cell, remember, has the ability to cram three bits of data in each cell, using a transistor that can store eight different charge levels. Because it can store more data in the same number of cells, TLC is very much cheaper per gigabyte than SLC (and cheaper than MLC), and it also enables more storage capacity to be built into a given space: it provides much higher storage density.
A tech TLC pode não ser o limite. Por cada estado adicional a capacidade aumenta exponencialmente.
Na actualidade já existe um SSD comercial de 100TB. O SSD de 1PB eventualmente chegara ao mercado num espaço de poucos anos. O grande desafio é alinhar camadas de transístores durante o fabrico massivo, basta pensar na complexidade de sobrepor biliões de transístores com uma margem erro de poucos nanómetros.
An obvious question then is what the limit is for high capacity SSDs? Samsung’s 32TB high capacity SSD is not slated for release before next year, but the company and its rivals are bound to be working on even high capacity products.
At the moment it is proving very hard to make NAND chips with more than 64 layers, but it seems inevitable that 96 and even 128 layer chips will be feasible sooner or later, once manufacturing techniques develop. For example Toshiba has talked about “super stacking” technology, which can stack more than 100 layers.
The 32-layer
stacks of cells are connected to over 2 billion channel holes that
have been etched from the top layer of the NAND to the bottom.
From a top-down view, the entirety of these holes can be seen
on a 128 GB NAND chip that is the size a fingernail.
Claro que uma coisa é fazer estes novos discos em laboratório, outra coisa é em produção e disponíveis comercialmente. Pensem que realmente o consumidor privado não tem sequer grande necessidade de ter um disco com mais de 1TB, principalmente com a disponibilidade do cloud que existe na actualidade. E isso pode ser um dos grandes entraves ao desenvolvimento das techs de armazenamento não volátil.
Neste terceiro artigorefere outras possíveis techs.
Thus far, SSD manufacturers have delivered better performance by offering faster data standards, more bandwidth, and more channels per controller — plus the use of SLC caches we mentioned earlier. Nonetheless, in the long run, it’s assumed NAND will be replaced by something else.
What that something else will look like is still open for debate. Both magnetic RAM and phase change memory have presented themselves as candidates, though both technologies are still in early stages and must overcome significant challenges to actually compete as a replacement to NAND. Whether consumers would notice the difference is an open question. If you’ve upgraded from NAND to an SSD and then upgraded to a faster SSD, you’re likely aware the gap between HDDs and SSDs is much larger than the SSD-to-SSD gap, even when upgrading from a relatively modest drive. Improving access times from milliseconds to microseconds matters a great deal, but improving them from microseconds to nanoseconds might fall below what humans can really perceive in most cases.
Neste terceiro artigo também se faz referência à alternativa da intel, que deixou de estar no mercado não empresarial porque simplesmente era demasiado cara para competir com o SSD tradicional, mas para as empresas em sectores nicho tem características muito interessantes.
From 2017 through early 2021, Intel offered its Optane memory as an alternative for NAND flash in the consumer market. In early 2021, the company announced it would no longer sell Optane drives in the consumer space, except for the H20 hybrid drive. H20 combines QLC NAND with an Optane cache to boost overall performance while reducing drive cost. While the H20 is an interesting and unique product, it doesn’t offer the same kind of top-end performance Optane SSDs did.
Optane will remain in-market in the enterprise server segment. While its reach is limited, it’s still the closest thing to a challenger that NAND has. Optane SSDs don’t use NAND — they’re built using non-volatile memory believed to be implemented similarly to phase-change RAM — but they offer similar sequential performance to current NAND flash drives, albeit with better performance at low drive queues. Drive latency is also roughly half of NAND flash (10 microseconds, versus 20) and vastly higher endurance (30 full drive-writes per day, compared with 10 full drive writes per day for a high-end Intel SSD).
A minha opinião no assunto é:






- Anexos
-
- nand_tech_arch.JPG (38.86 KiB) Visualizado 3660 vezes
-
- qlc_nand_density-640x360.jpg (37.8 KiB) Visualizado 3660 vezes
“It is not the strongest of the species that survives, nor the most intelligent, but rather the one most adaptable to change.”
― Leon C. Megginson
― Leon C. Megginson
Re: DNA Storage
Existe imensa literatura disponível que será melhor que qualquer exposição minha, mas para se perceber minimamente do que se está a falar, aqui fica uma comparação breve para duas "tecnologias".

O filão a vermelho representa um pedaço de ADN com cerca de 20nm de comprimento (a hélice tem 2nm de diametro) e tem capacidade teórica para cerca de 120 bits.
O quadrado a preto é uma bit-cell (=1 bit) para SRAM com litografia de 5nm e é o que é hoje mais coisa menos coisa comercialmente viável para SRAM pelo menos (onde ainda não se atingiu o limite, continua a tentar-se comprimir mais). Em todo o caso, tudo aquilo é 1 bit. O que usei na imagem é um quadrado representativo de cerca de 150nm de lado (as fontes referem que uma bit-cell ocupa cerca de 0.02um2, portanto será mais ou menos isto ou algo equivalente).
As espessuras não estão representadas e as medidas são aproximadas e meramente ilustrativas. Este tipo de valores podem ser facilmente conferidos em múltiplas fontes (segundo o roadmap da IEEE as densidades actuais andam pelos 29 a 50 Mbits por mm2 e projectam para 140 Mbits por mm2 lá para 2030-2033). Poderiam fazer-se comparações também com outras tecnologias, esta comparação não pretende ser exaustiva, é meramente ilustrativa para se ter uma percepção melhor do que realmente se está aqui a falar.
Se o ADN vai vingar comercialmente como tecnologia para data storage (de forma híbrida ou não e/ou só para determinado tipo de aplicação) é algo que teremos de aguardar para ver. O potencial teórico para uma capacidade de armazenamento em ADN muito superior ao que se consegue hoje com silício e/ou se vislumbra que se conseguirá a breve prazo existe e é isso que está reflectido na literatura. Se se vai conseguir ultrapassar os diversos desafios e dificuldades para tornar isto prático e comercialmente viável, enfim, aguardemos.
O filão a vermelho representa um pedaço de ADN com cerca de 20nm de comprimento (a hélice tem 2nm de diametro) e tem capacidade teórica para cerca de 120 bits.
O quadrado a preto é uma bit-cell (=1 bit) para SRAM com litografia de 5nm e é o que é hoje mais coisa menos coisa comercialmente viável para SRAM pelo menos (onde ainda não se atingiu o limite, continua a tentar-se comprimir mais). Em todo o caso, tudo aquilo é 1 bit. O que usei na imagem é um quadrado representativo de cerca de 150nm de lado (as fontes referem que uma bit-cell ocupa cerca de 0.02um2, portanto será mais ou menos isto ou algo equivalente).
As espessuras não estão representadas e as medidas são aproximadas e meramente ilustrativas. Este tipo de valores podem ser facilmente conferidos em múltiplas fontes (segundo o roadmap da IEEE as densidades actuais andam pelos 29 a 50 Mbits por mm2 e projectam para 140 Mbits por mm2 lá para 2030-2033). Poderiam fazer-se comparações também com outras tecnologias, esta comparação não pretende ser exaustiva, é meramente ilustrativa para se ter uma percepção melhor do que realmente se está aqui a falar.
Se o ADN vai vingar comercialmente como tecnologia para data storage (de forma híbrida ou não e/ou só para determinado tipo de aplicação) é algo que teremos de aguardar para ver. O potencial teórico para uma capacidade de armazenamento em ADN muito superior ao que se consegue hoje com silício e/ou se vislumbra que se conseguirá a breve prazo existe e é isso que está reflectido na literatura. Se se vai conseguir ultrapassar os diversos desafios e dificuldades para tornar isto prático e comercialmente viável, enfim, aguardemos.
FLOP - Fundamental Laws Of Profit
1. Mais vale perder um ganho que ganhar uma perda, a menos que se cumpra a Segunda Lei.
2. A expectativa de ganho deve superar a expectativa de perda, onde a expectativa mede a
__.amplitude média do ganho/perda contra a respectiva probabilidade.
3. A Primeira Lei não é mesmo necessária mas com Três Leis isto fica definitivamente mais giro.
Re: DNA Storage
BearManBull Escreveu:Literalmente argumentam que um datacenter passara a caber em menos de uma grama de ADN....
O que "os artigos dizem" é que o ADN (em si) tem capacidade para armazenar informação nessas ordens de grandeza. O que são utilizados são factos e/ou dados conhecidos (a menos que estejam incorrectos, altura em que não passam a revisão numa revista que se preze). Não é o mesmo que dizer que se vai atingir isso na prática numa solução comercial aí ao virar da esquina e um artigo que se preze numa revista que se preze faz igualmente referência às dificuldades, aos desafios e às desvantagens. Um dos artigos que coloquei e depois do qual pegaste numa frase truncada do abstract para fazer uma piada ou lá o que aquilo era faz isso.
Para não estar aqui a colocar o artigo completo, fica só a conclusão (mas para quem estiver interessado eu aconselho a ler o míolo e a não se ficar só por este artigo tão pouco):
Developing a novel method to store an astronomical amount of data in the modest double-stranded DNA molecule is no more a matter confined to the realms of science fiction. Like any revolution in technology, DNA-based digital data storage has to face major challenges in coming years to fulfill its tremendous potential. According to theories today, just a few grams of DNA can store all the information ever produced by mankind. To reach the commercial mainstream for data retrieval, DNA-based digital storage has to make several breakthroughs. Emerging technologies such as nanopore sequencing have facilitated a 50,000-fold reduction in the cost of DNA sequencing, from USD 31,250/MB in 2002 to USD 0.63 in 2016 (Shendure and Aiden 2012). An analysis has revealed that the cost to read and write information on DNA has reduced to ~ USD 10−7/bit and ~ USD 10−4/bit, respectively (Zhirnov et al. 2016). The renowned mathematician and genome scientist Nick Goldman once said: “As DNA is the basis of life on Earth, methods for working with it, storing it and retrieving it will remain the subject of continual technological innovation”. Looking into the future, it could be predicted that to handle an enormous amount of data, a practical large-scale DNA archive would apparently need stable DNA management and innovative indexing solutions. This will result in a favorable paradigm shift in computing, as the aspect of data storage would be an integral part in the realization of the idea of DNA computing. This development will mutually benefit research and development in sequencing and synthesis technologies. However, the synthesis of long-stranded DNA molecules with low error rates desired for the process of data archiving will still take a considerable amount of time to reach practical levels of higher reliability. In addition, synthesizing long strands of DNA with high fidelity and then sequencing them back to accurately recover the information will involve a high-throughput laboratory and skilled manpower. With the advancement of technology in the coming years, the cost of writing on DNA and reading it will come down. However, DNA-based data storage is bound to face competition with the more traditional means of data storage which are ubiquitous, inexpensive, and user-friendly (for example, conventional large capacity disk storage costs as little as USD 0.05 per gigabyte today, down from USD 500,000.00 per gigabyte back in the early 1980s). Overall, this technology has already developed a momentum with the potential to transform our vision for the future of digital storage. It would not be far-fetched to assume that DNA, if not by itself, then at least as a hybrid with silicon, could also do a fantastic job as storage media of the future.
Este artigo é de 2018, mas há dezenas deles facilmente acessíveis e muito mais informação para absorver / assimilar e para considerar / acompanhar.
Como disse atrás também, hoje já não são só meras "considerações teóricas", existem entretanto já resultados experimentais também. Já se passou a fase de mero conceito teórico, ainda não se chegou à fase de solução comercial viável (e eu não sei se se chegará).
FLOP - Fundamental Laws Of Profit
1. Mais vale perder um ganho que ganhar uma perda, a menos que se cumpra a Segunda Lei.
2. A expectativa de ganho deve superar a expectativa de perda, onde a expectativa mede a
__.amplitude média do ganho/perda contra a respectiva probabilidade.
3. A Primeira Lei não é mesmo necessária mas com Três Leis isto fica definitivamente mais giro.
Re: DNA Storage
MarcoAntonio Escreveu:BearManBull Escreveu:Como não justifiquei? Claro que justifiquei se empilhares 4 transístores, consegues guardar os mesmo bits que em dois nucleótidos.
Como o transístor tem 5nm e o ADN 2nm se comparares lado a lado ves que terias 4 bit por 20nm e 4 bit por 2nm, ou seja 10 vezes menos, uma ordem de grandeza. Isso já foi justificado 3 ou 4 vezes...
Epá, estas contas não estão bem nem representam as limitações físicas nem eu vou estar a argumentar mais em resposta a coisas destas.
É a referência que existe.
Em teoria num stack de transístor actual podes armazenar informação quaase ao mesmo nível do que se pode fazer com ADN.
“It is not the strongest of the species that survives, nor the most intelligent, but rather the one most adaptable to change.”
― Leon C. Megginson
― Leon C. Megginson
Re: DNA Storage
MarcoAntonio Escreveu:O meu propósito não é convencer-te de nada. Se o teu ponto é o de que achas que não vai vingar por ser essa a tua convicção, então força para a frente, siga para bingo. Há uma bastante razoável probabilidade (que eu confesso que não consigo quantificar) de acertares!
Não é bem assim tenho argumentado o porque acho que estão a exagerar na análise do que prometem.
Literalmente argumentam que um datacenter passara a caber em menos de uma grama de ADN....
Acho que nem o próprio mercado procura uma solução desse tipo. Armazenar 1PB num unico ponto pode ser um problema grave, mais ainda para organizar e intrepretar os dados de forma eficiente.
“It is not the strongest of the species that survives, nor the most intelligent, but rather the one most adaptable to change.”
― Leon C. Megginson
― Leon C. Megginson
Re: DNA Storage
BearManBull Escreveu:Como não justifiquei? Claro que justifiquei se empilhares 4 transístores, consegues guardar os mesmo bits que em dois nucleótidos.
Como o transístor tem 5nm e o ADN 2nm se comparares lado a lado ves que terias 4 bit por 20nm e 4 bit por 2nm, ou seja 10 vezes menos, uma ordem de grandeza. Isso já foi justificado 3 ou 4 vezes...
Epá, estas contas não estão bem nem representam as limitações físicas nem eu vou estar a argumentar mais em resposta a coisas destas.
FLOP - Fundamental Laws Of Profit
1. Mais vale perder um ganho que ganhar uma perda, a menos que se cumpra a Segunda Lei.
2. A expectativa de ganho deve superar a expectativa de perda, onde a expectativa mede a
__.amplitude média do ganho/perda contra a respectiva probabilidade.
3. A Primeira Lei não é mesmo necessária mas com Três Leis isto fica definitivamente mais giro.
Re: DNA Storage
MarcoAntonio Escreveu:BearManBull Escreveu:A comparação foi em termos de escala do que se usa actualmente na indústria.
A comparação foi para tu alegares um limite teórico criado por ti que nunca justificaste. Entretanto deixaste de achar que fazia sentido comparar soluções comerciais com capacidades teóricas de uma tecnologia em investigação e assim sendo eu também.BearManBull Escreveu:Talvez se consiga arranhar um único nível de ordem de grandeza (teórico) superior e não vários, mas não passa disso.
Como não justifiquei? Claro que justifiquei se empilhares 4 transístores, consegues guardar os mesmo bits que em dois nucleótidos.
Como o transístor tem 5nm e o ADN 2nm se comparares lado a lado ves que terias 4 bit por 20nm e 4 bit por 2nm, ou seja 10 vezes menos, uma ordem de grandeza. Isso já foi justificado 3 ou 4 vezes...
“It is not the strongest of the species that survives, nor the most intelligent, but rather the one most adaptable to change.”
― Leon C. Megginson
― Leon C. Megginson
Re: DNA Storage
BearManBull Escreveu:Não sei quem introduziu a questão da entropia não fui eu,
Ora bolas, a entropia estava mencionada num texto que citei especificamente sobre o genoma humano e respectivo conteúdo informativo. Quão relevante era para o tópico? A relevância era mais do que a suficiente tendo em conta que naquela altura estavas a falar em relações de 1 bit por molécula/símbolo. Tendo eu já esclarecido então que o ADN é quaternário, o texto mostrava também que a natureza (mesmo sem atingir o valor óptimo) armazena mais conteúdo informativo por símbolo do que o valor que estavas a indicar/utilizar.
BearManBull Escreveu:Como é que isso impacta o calculo de capacidade em bits para o sistema de ADN. Neste caso seria conversão base2 a base4.
Eu não entendo o que estás a dizer.
FLOP - Fundamental Laws Of Profit
1. Mais vale perder um ganho que ganhar uma perda, a menos que se cumpra a Segunda Lei.
2. A expectativa de ganho deve superar a expectativa de perda, onde a expectativa mede a
__.amplitude média do ganho/perda contra a respectiva probabilidade.
3. A Primeira Lei não é mesmo necessária mas com Três Leis isto fica definitivamente mais giro.
Re: DNA Storage
E para que fique tudo bem claro e se perceba bem o que é que eu penso (parte já estava dito):
Eu não sei se o ADN algum dia vai vingar como solução comercial para o armazenamento de informação. Os próprios artigos que mencionei (assim como muitos outros) apresentam desafios a vencer e as dificuldades práticas correntes. E vivo e convivo bem de perto com estas realidades para saber que estas "promessas" tecnológicas frequentemente nunca chegam a vingar. Ou pelos custos ou por limitações práticas que condicionam a viabilidade e nunca chegam a ser resolvidas ou porque entretanto surge uma solução melhor que anos antes ninguém estava a ver/prever e que derivam de um breakthrough inesperado.
O meu propósito não é convencer-te de nada. Se o teu ponto é o de que achas que não vai vingar por ser essa a tua convicção, então força para a frente, siga para bingo. Há uma bastante razoável probabilidade (que eu confesso que não consigo quantificar) de acertares!
Eu não sei se o ADN algum dia vai vingar como solução comercial para o armazenamento de informação. Os próprios artigos que mencionei (assim como muitos outros) apresentam desafios a vencer e as dificuldades práticas correntes. E vivo e convivo bem de perto com estas realidades para saber que estas "promessas" tecnológicas frequentemente nunca chegam a vingar. Ou pelos custos ou por limitações práticas que condicionam a viabilidade e nunca chegam a ser resolvidas ou porque entretanto surge uma solução melhor que anos antes ninguém estava a ver/prever e que derivam de um breakthrough inesperado.
O meu propósito não é convencer-te de nada. Se o teu ponto é o de que achas que não vai vingar por ser essa a tua convicção, então força para a frente, siga para bingo. Há uma bastante razoável probabilidade (que eu confesso que não consigo quantificar) de acertares!
FLOP - Fundamental Laws Of Profit
1. Mais vale perder um ganho que ganhar uma perda, a menos que se cumpra a Segunda Lei.
2. A expectativa de ganho deve superar a expectativa de perda, onde a expectativa mede a
__.amplitude média do ganho/perda contra a respectiva probabilidade.
3. A Primeira Lei não é mesmo necessária mas com Três Leis isto fica definitivamente mais giro.
Re: DNA Storage
MarcoAntonio Escreveu:BearManBull Escreveu:Podes explicar como aplicas o conceito de entropia numa conversão de binário a hexadecimal?
Eu não entendo o que estás a perguntar ao certo. Podes reformular a pergunta?
Não sei quem introduziu a questão da entropia não fui eu,
Como é que isso impacta o calculo de capacidade em bits para o sistema de ADN. Neste caso seria conversão base2 a base4.
“It is not the strongest of the species that survives, nor the most intelligent, but rather the one most adaptable to change.”
― Leon C. Megginson
― Leon C. Megginson
Re: DNA Storage
BearManBull Escreveu:A comparação foi em termos de escala do que se usa actualmente na indústria.
A comparação foi para tu alegares um limite teórico criado por ti que nunca justificaste. Entretanto deixaste de achar que fazia sentido comparar soluções comerciais com capacidades teóricas de uma tecnologia em investigação e assim sendo eu também.
BearManBull Escreveu:Talvez se consiga arranhar um único nível de ordem de grandeza (teórico) superior e não vários, mas não passa disso.
FLOP - Fundamental Laws Of Profit
1. Mais vale perder um ganho que ganhar uma perda, a menos que se cumpra a Segunda Lei.
2. A expectativa de ganho deve superar a expectativa de perda, onde a expectativa mede a
__.amplitude média do ganho/perda contra a respectiva probabilidade.
3. A Primeira Lei não é mesmo necessária mas com Três Leis isto fica definitivamente mais giro.
Re: DNA Storage
MarcoAntonio Escreveu:então porque é que te puseste tu a comparar e tens estado a tentar comparar o tempo todo? Não se entende. Parece que só se pode comparar se for para concluir que achas que não vai ser uma revolução. Enfim...
A comparação foi em termos de escala do que se usa actualmente na indústria.
“It is not the strongest of the species that survives, nor the most intelligent, but rather the one most adaptable to change.”
― Leon C. Megginson
― Leon C. Megginson
Re: DNA Storage
BearManBull Escreveu:Claro que se procura com o cross entropy minimization.
A cross entropy (entropia cruzada) e a entropia não são a mesma coisa. Na transmissão de informação a solução passa muitas vezes por minimizar a entropia condicional (que é ainda outra coisa). A relação é esta e ajuda a perceber porque é que pode haver interesse em reduzir a entropia condicional (note-se que se procura na transmissão maximizar a Informação Mútua, o que representa a capacidade de canal):
I(X,Y) = H(X) - H(X|Y)
(o segundo termo do segundo membro é a entropia condicional e como frequentemente não podemos manipular a entropia da fonte, a maximização da transmissão de informação pode passar por minimizar o segundo termo)
A entropia cruzada por sua vez é H(X,Y) e não é o mesmo que a entropia condicional. Sei bem que métodos de minimização da entropia cruzada têm sido vindo a ser propostos/utilizados em machine learning.
BearManBull Escreveu:Podes explicar como aplicas o conceito de entropia numa conversão de binário a hexadecimal?
Eu não entendo o que estás a perguntar ao certo. Podes reformular a pergunta?
FLOP - Fundamental Laws Of Profit
1. Mais vale perder um ganho que ganhar uma perda, a menos que se cumpra a Segunda Lei.
2. A expectativa de ganho deve superar a expectativa de perda, onde a expectativa mede a
__.amplitude média do ganho/perda contra a respectiva probabilidade.
3. A Primeira Lei não é mesmo necessária mas com Três Leis isto fica definitivamente mais giro.
Re: DNA Storage
MarcoAntonio Escreveu:Credo. A entropia não é um processo nem pretende determinar nada do que estás para aqui a escrever. Nem se procura "minimizar a entropia". Não se aproveita nada deste parágrafo...
Claro que se procura com o cross entropy minimization.
Podes explicar como aplicas o conceito de entropia numa conversão de binário a hexadecimal?
“It is not the strongest of the species that survives, nor the most intelligent, but rather the one most adaptable to change.”
― Leon C. Megginson
― Leon C. Megginson
Re: DNA Storage
BearManBull Escreveu:A conversão de bases numéricas é um processo matemático linear. Não tem nada que ver com informação é matemática fundamental de representação numérica. A entropia na informação é um processo não linear que pretende determinar qual é a conversão óptima de símbolos para usar num canal de comunicação para ter a menor entropia possível, ou seja minimizar uso de símbolos transmitidos de forma supérflua, tendo em conta a probabilidade ocorrer de cada símbolo convertido.
Credo. A entropia não é um processo nem pretende determinar nada do que estás para aqui a escrever. Nem se procura "minimizar a entropia". Não se aproveita nada deste parágrafo...
BearManBull Escreveu:Estás-me a pedir para ler um artigo [i]científico/i] que me parece demasiado sencionalista...
Eu não estou a sugerir-te para ler um artigo científico em específico. Há literalmente dezenas e dezenas e dezenas de artigos científicos disponíveis e acessíveis em open access para te esclareceres melhor.
E se tu não achas que vale a pena comparar a capacidade que temos actualmente para armazenar informação em tecnologia baseada em silício (ou outra) com aquela que potencialmente se conseguiria numa tecnologia baseada em DNA (para o que há apenas resultados experimentais) então porque é que te puseste tu a comparar e tens estado a tentar comparar o tempo todo? Não se entende. Parece que só se pode comparar se for para concluir que achas que não vai ser uma revolução. Enfim...
FLOP - Fundamental Laws Of Profit
1. Mais vale perder um ganho que ganhar uma perda, a menos que se cumpra a Segunda Lei.
2. A expectativa de ganho deve superar a expectativa de perda, onde a expectativa mede a
__.amplitude média do ganho/perda contra a respectiva probabilidade.
3. A Primeira Lei não é mesmo necessária mas com Três Leis isto fica definitivamente mais giro.
Re: DNA Storage
A conversão de bases numéricas é um processo matemático linear. Não tem nada que ver com informação é matemática fundamental de representação numérica. A entropia na informação é um processo não linear que pretende determinar qual é a conversão óptima de símbolos para usar num canal de comunicação para ter a menor entropia possível, ou seja minimizar uso de símbolos transmitidos de forma supérflua, tendo em conta a probabilidade ocorrer de cada símbolo convertido.
Estás-me a pedir para ler um artigo [i]científico/i] que me parece demasiado sencionalista...
Isto mais parece um anúncio de um filme da netflix... Novamente digo que não tem absolutamente nenhum sentido comparar ADN com CD-ROMs isso é um exercício sem analogia porque para recuperar dados de ADN terias de descodificar a estrutura completamente e carregar esses dados numa memória volátil intermédia para ser processados o que seria uma pescada de rabo na boca. É um nonsense, ou banha de cobra. Por isso a comparação que teria sentido seria com uma stack de transístores, mas ninguém produz isso porque não serve de nada na prática.
Fisicamente impossível para o ADN -> parece-me o acesso por registo de memória, ou seja e.g.:aceder ao gene abc n posição 50 por um sistema de endereçamento. Terá de ser descodificado e guardado noutro meio para depois poder ser acedido. Portanto é um bocado a dar para o inútil. Ou teria de ser cortado em pedaços (e.g.:gene a gene) que estariam em containers com um registo de memória o que me parece que novamente cai numa pescadinha de rabo na boca, porque exigira uma tech hibrida.
A mehor analogia de um sistema para guardar dados para comparar com ADN seria o de um microscópio de varrimento este é provavelmente o meio teórico que permite guardar mais informação conhecido, mas isto tem aplicação prática? Não.
Estás-me a pedir para ler um artigo [i]científico/i] que me parece demasiado sencionalista...
This emerging field of DNA as means of data storage has the potential to transform science fiction into reality,
Isto mais parece um anúncio de um filme da netflix... Novamente digo que não tem absolutamente nenhum sentido comparar ADN com CD-ROMs isso é um exercício sem analogia porque para recuperar dados de ADN terias de descodificar a estrutura completamente e carregar esses dados numa memória volátil intermédia para ser processados o que seria uma pescada de rabo na boca. É um nonsense, ou banha de cobra. Por isso a comparação que teria sentido seria com uma stack de transístores, mas ninguém produz isso porque não serve de nada na prática.
Fisicamente impossível para o ADN -> parece-me o acesso por registo de memória, ou seja e.g.:aceder ao gene abc n posição 50 por um sistema de endereçamento. Terá de ser descodificado e guardado noutro meio para depois poder ser acedido. Portanto é um bocado a dar para o inútil. Ou teria de ser cortado em pedaços (e.g.:gene a gene) que estariam em containers com um registo de memória o que me parece que novamente cai numa pescadinha de rabo na boca, porque exigira uma tech hibrida.
A mehor analogia de um sistema para guardar dados para comparar com ADN seria o de um microscópio de varrimento este é provavelmente o meio teórico que permite guardar mais informação conhecido, mas isto tem aplicação prática? Não.
- Anexos
-
- IBM.gif (37.97 KiB) Visualizado 9239 vezes
“It is not the strongest of the species that survives, nor the most intelligent, but rather the one most adaptable to change.”
― Leon C. Megginson
― Leon C. Megginson
Re: DNA Storage
BearManBull Escreveu:A entropia não é linear e não é relevante para o que se estava a discutir (capacidade teórica de armazenar informação ADN vs transístor). A entropia só se aplica na transmissão de informação e isso era o que queria caracterizar com mundo real em que determinado valor tem maior probabilidade de ocorrer do que outro.
A entropia não é só relevante para a transmissão de informação (aliás, o domínio da entropia é o da codificação da fonte; os conceitos mais relevantes para a transmissão de informação serão até a informação mútua e capacidade de canal). Além do mais, não quero tornar isto numa maçada mas o que tu escreveste inicialmente foi e cito "nem percebo o que tem a haver a entropia com um sistema linear".
BearManBull Escreveu:Estás a comparar um sistema prático com um teórico. É o mesmo que dizer que a uma nave viajar à velocidade da luz é mais rápida que um foguetão. O problema é que é fisicamente impossível.
Ao certo, o que é que estás a definir como fisicamente impossível num sistema teoricamente baseado em ADN que não permitiria mais do que uma ordem de grandeza acima do silício (que é o que tens estado a impor) que faça esta analogia com a velocidade da luz ter sentido?
A tecnologia baseada em silício é uma tecnologia comercial e amadurecida. A tecnologia baseada em ADN neste momento é uma tecnologia experimental (em fase de investigação) não comercial, apenas testada em laboratório (já passou a fase de mero conceito teórico).
BearManBull Escreveu:Suponho que na tua opinião um transístor de 5nm não consegue armazenar 1bit? Certo é que com a conclusão de várias ordens de grandeza (que afirmaste com base na medida unidimensional do comprimento) tens de assumir que isso é impossível. Na realidade de momento até é impraticável, tanto como a tecnologia de storage em ADN.
Pela enésima vez, consulta as fontes.
Comercialmente falando, a tecnologia baseada em ADN não é praticável e vou voltar a dizer (julgo que pela terceira vez) que não sei se alguma vez irá vingar.
FLOP - Fundamental Laws Of Profit
1. Mais vale perder um ganho que ganhar uma perda, a menos que se cumpra a Segunda Lei.
2. A expectativa de ganho deve superar a expectativa de perda, onde a expectativa mede a
__.amplitude média do ganho/perda contra a respectiva probabilidade.
3. A Primeira Lei não é mesmo necessária mas com Três Leis isto fica definitivamente mais giro.
Re: DNA Storage
MarcoAntonio Escreveu:
Quanto às medidas, o armazenamento não é unidemensional, tu estás a pegar na medida maior de todas e a correr com isso. Novamente convido-te a reler as diversas fontes disponíveis para verificares quanto é possível armazenar por unidade de volume com ADN (e que é teoricamente várias ordens de grandeza superior ao que se consegue hoje com silício).
Estás a comparar um sistema prático com um teórico. É o mesmo que dizer que a uma nave viajar à velocidade da luz é mais rápida que um foguetão. O problema é que é fisicamente impossível. A maquinaria para descodificar e recodificar ADN e mesmo para sustentar o ADN sem se deteriorar quanto volume ocuparia? Por isso fazer alusão a uma tecnologia real vs uma imaginária é que não tem qualquer sentido. Quem te diz que o meio que teria de envolver/assentar/proteger o ADN não acabaria por piorar a a volumétrica que estás a comparar é que estás a falar de ADN livre sem qualquer meio, novamente uma sopa... Estás a comparar limitações da engenharia de uma tecnologia real com um conceito teórico. Mais que o foco da industria não é só capacidade, a velocidade e a fiabilidade dos produtos são cruciais.
A referência unidimensional foi a abordagem para este tópico e é o standard da industria.
Suponho que na tua opinião um transístor de 5nm não consegue armazenar 1bit? Certo é que com a conclusão de várias ordens de grandeza (que afirmaste com base na medida unidimensional do comprimento) tens de assumir que isso é impossível. Na realidade de momento até é impraticável, tanto como a tecnologia de storage em ADN.
Mas temos transístores de 5nm (A15 Apple) isso é um facto e funcionam são reais e usados comercialmente.
A entropia não é linear e não é relevante para o que se estava a discutir (capacidade teórica de armazenar informação ADN vs transístor). A entropia só se aplica na transmissão de informação e isso era o que queria caracterizar com mundo real em que determinado valor tem maior probabilidade de ocorrer do que outro.
“It is not the strongest of the species that survives, nor the most intelligent, but rather the one most adaptable to change.”
― Leon C. Megginson
― Leon C. Megginson
Re: DNA Storage
BearManBull Escreveu:A fórmula de entropia ao conter um logaritmo é não linear.
A formula/definição da entropia é uma coisa, o sistema em análise é outro. A entropia não classifica nem depende de / tem que ver com o sistema ser linear ou não linear, vai aqui uma grande confusão de conceitos. A entropia quantifica informação ao nível da codificação da fonte.
BearManBull Escreveu:A entropia só tem significado quando se fala de mundo real e aí sim depende do contexto da tradução de símbolos, aqui considerando o melhor cenário cada nucleóide vai conter 2 bits.
Eu não faço ideia do que é que tu queres dizer com "só tem significado quando se fala de mundo real". O "melhor cenário" de que estás a falar é o que se chama de entropia máxima, a que eu fiz referência precisamente no post que estás a citar, convido-te a reler pois encontra-se lá (esta também surge na literatura como Hartley entropy e vem normalmente representada por Ho, não confundir com hipótese nula que usa a mesma notação).
Já agora, a entropia não depende do contexto da tradução dos símbolos, depende dos símbolos disponíveis e respectivas pdf.
BearManBull Escreveu:Nem sei para que fizeste referência a isso porque só reduz a capacidade de um sistema óptimo, que era o que se estava a demonstrar.
Eu partilhei várias fontes e uma porção de texto que, entre outras coisas, referia a entropia (quantificava-se ali a informação contida no genoma humano, especificamente) ao que tu respondeste que não percebias o que a entropia tinha que ver com sistemas lineares (que é uma frase basicamente sem sentido) pelo que deixei mais alguns esclarecimentos adicionais.
Quanto às medidas, o armazenamento não é unidemensional, tu estás a pegar na medida maior de todas e a correr com isso. Novamente convido-te a reler as diversas fontes disponíveis para verificares quanto é possível armazenar por unidade de volume com ADN (e que é teoricamente várias ordens de grandeza superior ao que se consegue hoje com silício).
Quanto às limitações, há muitas (estão por exemplo citadas nas fontes que utilizei) e em lado nenhum eu fiz qualquer alegação sobre a praticalidade da tecnologia de ADN a curto-prazo (nem sei se algum dia vai vingar, penso mesmo que escrevi algo nesse sentido num dos posts anteriores).
FLOP - Fundamental Laws Of Profit
1. Mais vale perder um ganho que ganhar uma perda, a menos que se cumpra a Segunda Lei.
2. A expectativa de ganho deve superar a expectativa de perda, onde a expectativa mede a
__.amplitude média do ganho/perda contra a respectiva probabilidade.
3. A Primeira Lei não é mesmo necessária mas com Três Leis isto fica definitivamente mais giro.
Re: DNA Storage
MarcoAntonio Escreveu:BearManBull Escreveu:O que queres dizer com contexto?
A base é 4 e tu estás a falar em converter base 2 em base 4 (e que com isso se perde eventualmente capacidade). Não se entende bem o que estás a dizer.BearManBull Escreveu:Não consigo perceber como se vai encaixar tanta informação, nem percebo o que tem a haver a entropia com um sistema linear.
Não tem nada que ver com sistemas lineares e não lineares. Entropia é um conceito elementar (e extremamente importante) em Teoria da Informação e expressa o conteúdo informativo por símbolo num dado alfabeto, tendo em conta a distribuição/frequência dos símbolos. Está intimamente ligado com o conceito de surpresa/incerteza (e.g. se um símbolo é certo então não transmite/carrega nenhuma informação). A entropia é máxima quando os símbolos são todos equiprováveis entre si (o que não ocorre no genoma humano, daí que a entropia seja um pouco inferior a dois bits em média).
A entropia é dada por H(X) = SUM [ p(Xi) . log (1 / p(Xi) ) ] em que Xi ´e o simbolo de índice i nesse alfabeto X.
Podes utilizar qualquer logarítmo: se utilizares base 2, o resultado vem dado em bits (que é o que é usado tipicamente); se utilizares ln o resultado vem dado em nats (onde 1 nat ~= 1.44 bits).
BearManBull Escreveu:Ou seja as minhas contas estavam erradas e então o ADN pode conter 1 bit em apenas 0,5nm. Talvez se consiga arranhar um único nível de ordem de grandeza (teórico) superior e não vários, mas não passa disso.
Consulta as fontes que já partilhei ou uma série de outras disponíveis na web, isto não está correcto, sorry.
Na altura disse que a base 4 me parecia prejudicial, não tinha feito nenhuma afirmação. Estava com a ideia que sim mas não tinha "feito as contas". Deixei aqui uma conversão possível que realmente nessa base se pode ter 2 bits por símbolo.
Portanto atendendo à conversão de exemplo que dei.
A 00
G 01
T 10
C 11
Para escrever o número 10 em ADNès: seria TT em binário é 1010. Ou seja aquilo que ocupa 4 transístores em ADN ocuparia dois nucleóides.
A fórmula de entropia ao conter um logaritmo é não linear.
A entropia só tem significado quando se fala de mundo real e aí sim depende do contexto da tradução de símbolos, aqui considerando o melhor cenário cada nucleóide vai conter 2 bits. Nem sei para que fizeste referência a isso porque só reduz a capacidade de um sistema óptimo, que era o que se estava a demonstrar.
A discussão foi ADN não nucleóides isolodados. Os nucleóides não podem viver sozinhos, uma sopa de nucleóides não teria absolutamente nenhum significado. Dividir por 0,33 nm não é uma abordagem correcta. Considerando que o ADN tem uma largura de 2nm que já é altamente undervalue pelo que li, assim para ADN teríamos uma relação máxima de representação de 2 bit por cada 1nm (largura). Nos transístores mais pequenos comercialmente disponíveis temos 1bit por 5nm, portanto quando muito teríamos uma única ordem de grandeza teórica em cenários completamente óptimos.
Falar de revolução parece-me amplamente exagerado. Duvido que a indústria siga esse caminho para storage comercial de informação. Para não falar nas limitações de uma tech de ADN...
O ADN não tem capacidades como random access (quando se lê tem de ser ler tudo de uma ponta à outra), imagino que para criar algo desse tipo a tecnologia teria de crescer substancialmente em tamanho, tal como acontece com os sistemas de memória actuais que estão longe usar um único transístor por bit.
“It is not the strongest of the species that survives, nor the most intelligent, but rather the one most adaptable to change.”
― Leon C. Megginson
― Leon C. Megginson
DNA Storage
Para não estar a exagerar no off topic no trading ideas, crio este.
“It is not the strongest of the species that survives, nor the most intelligent, but rather the one most adaptable to change.”
― Leon C. Megginson
― Leon C. Megginson
Trading ideas.
BearManBull Escreveu:O que queres dizer com contexto?
A base é 4 e tu estás a falar em converter base 2 em base 4 (e que com isso se perde eventualmente capacidade). Não se entende bem o que estás a dizer.
BearManBull Escreveu:Não consigo perceber como se vai encaixar tanta informação, nem percebo o que tem a haver a entropia com um sistema linear.
Não tem nada que ver com sistemas lineares e não lineares. Entropia é um conceito elementar (e extremamente importante) em Teoria da Informação e expressa o conteúdo informativo por símbolo num dado alfabeto, tendo em conta a distribuição/frequência dos símbolos. Está intimamente ligado com o conceito de surpresa/incerteza (e.g. se um símbolo é certo então não transmite/carrega nenhuma informação). A entropia é máxima quando os símbolos são todos equiprováveis entre si (o que não ocorre no genoma humano, daí que a entropia seja um pouco inferior a dois bits em média).
A entropia é dada por H(X) = SUM [ p(Xi) . log (1 / p(Xi) ) ] em que Xi ´e o simbolo de índice i nesse alfabeto X.
Podes utilizar qualquer logarítmo: se utilizares base 2, o resultado vem dado em bits (que é o que é usado tipicamente); se utilizares ln o resultado vem dado em nats (onde 1 nat ~= 1.44 bits).
BearManBull Escreveu:Ou seja as minhas contas estavam erradas e então o ADN pode conter 1 bit em apenas 0,5nm. Talvez se consiga arranhar um único nível de ordem de grandeza (teórico) superior e não vários, mas não passa disso.
Consulta as fontes que já partilhei ou uma série de outras disponíveis na web, isto não está correcto, sorry.
FLOP - Fundamental Laws Of Profit
1. Mais vale perder um ganho que ganhar uma perda, a menos que se cumpra a Segunda Lei.
2. A expectativa de ganho deve superar a expectativa de perda, onde a expectativa mede a
__.amplitude média do ganho/perda contra a respectiva probabilidade.
3. A Primeira Lei não é mesmo necessária mas com Três Leis isto fica definitivamente mais giro.
Re: Trading ideas.
BearManBull Escreveu:
No vídeo fala de correspondência directa de 1 bit uma molécula...
Eu interpretei que eles atribuem por exemplos As e Cs a 1 e Ts e Gs a 0. Podes converter uma base2 numa base4 mas penso que isso só vai reduzir a capacidade do sistema.
Relativo a medidas a cadeia de ADN tem 2 nm de largura e como o nucleóide não pode existir sozinho estamos a falar 1nm por nucleóide. Tem de se somar as pontas e ponte ao valor de 0,33nm. Portanto a ordem é a mesma 5-7 nm vs 1nm. Abaixo de 1nm parece ser realmente impossível gerar bits com o conhecimento da física actual, necessitamos de um Moore do século XXI.
Independentemente do que um grupo de investigadores em particular pretende fazer/implementar, o ADN é quaternário (= base 4). A base é o número de símbolos diferentes disponíveis no alfabeto numa dada linguagem. Quanto à capacidade, medida em bits, podes confirmar os valores que indiquei por exemplo nestas referências:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5935598/
https://bmcresnotes.biomedcentral.com/t ... 4137-z.pdf
Também aqui alguma informação resumida com uma série de referências:
The haploid human genome (23 chromosomes) is about 3 billion base pairs long and contains around 30,000 genes.[30] Since every base pair can be coded by 2 bits, this is about 750 megabytes of data. An individual somatic (diploid) cell contains twice this amount, that is, about 6 billion base pairs. Men have fewer than women because the Y chromosome is about 57 million base pairs whereas the X is about 156 million. Since individual genomes vary in sequence by less than 1% from each other, the variations of a given human's genome from a common reference can be losslessly compressed to roughly 4 megabytes.[31]
The entropy rate of the genome differs significantly between coding and non-coding sequences. It is close to the maximum of 2 bits per base pair for the coding sequences (about 45 million base pairs), but less for the non-coding parts. It ranges between 1.5 and 1.9 bits per base pair for the individual chromosome, except for the Y-chromosome, which has an entropy rate below 0.9 bits per base pair.[32]
https://en.wikipedia.org/wiki/Human_genome
Resumindo, se utilizarmos o genoma humano (male) como referência:
6.27 Gbp -> 12.5*10^9 bits
205cm -> 2.05*10^9 nm
Logo ~= 6.1 bits/nm
(um limite teórico aproximado, na prática será sempre menos que isto)
Em termos de densidade de informação por unidade de volume e comparado com o silício, a capacidade teórica é várias ordens de grandeza superior. Claro que existem obstáculos e desvantagens técnicas e práticas também, se isto alguma vez vai ser uma alternativa realista, ainda vamos ter de esperar para ver.
O que querias dizer ao certo, neste contexto, com converter uma base 2 numa base 4?
FLOP - Fundamental Laws Of Profit
1. Mais vale perder um ganho que ganhar uma perda, a menos que se cumpra a Segunda Lei.
2. A expectativa de ganho deve superar a expectativa de perda, onde a expectativa mede a
__.amplitude média do ganho/perda contra a respectiva probabilidade.
3. A Primeira Lei não é mesmo necessária mas com Três Leis isto fica definitivamente mais giro.
Re: Trading ideas.
MarcoAntonio Escreveu:BearManBull Escreveu:Os transístores actuais são de uma escala à volta dos 10nm (dependendo do tipo de memoria pode ser a relação de 1 bit para 1 transístor), as moléculas de ADN estão em torno de 1nm. Mesmo que se tenha uma relação 1bit para 1 molécula de ADN (A,C,T ou G) não sei ate que ponto vai ser tão revolucionário...
O ADN é uma estrutura quaternária (isto é, 2 bits por símbolo) e julgo que há aqui uma substancial confusão pois uma molécula de ADN não corresponde a um símbolo, mas uma cadeia de símbolos. Na prática não se consegue guardar 2 bits por símbolo em ADN mas algo menos dado que é preciso incorporar um código corrector de erros (ECC) para compensar os erros de escrita/leitura.
Edit: aqui ficam as medidas aproximadas disponíveis na literatura, cada par de bases (=1 simbolo ~= 2 bits) mede cerca de 0.34 nm; isto corresponde na prática a qualquer coisa na ordem de 5 a 6 bits por 1nm como limite teórico; em comparação com silício e em termos de densidade de informação por unidade de volume, estamos a falar de várias ordens de grandeza superior.
No vídeo fala de correspondência directa de 1 bit uma molécula...
Eu interpretei que eles atribuem por exemplos As e Cs a 1 e Ts e Gs a 0. Podes converter uma base2 numa base4 mas penso que isso só vai reduzir a capacidade do sistema.
Relativo a medidas a cadeia de ADN tem 2 nm de largura e como o nucleóide não pode existir sozinho estamos a falar 1nm por nucleóide. Tem de se somar as pontas e ponte ao valor de 0,33nm. Portanto a ordem é a mesma 5-7 nm vs 1nm. Abaixo de 1nm parece ser realmente impossível gerar bits com o conhecimento da física actual, necessitamos de um Moore do século XXI.
Sorry pelo off topic. Para compensar deixo aqui um gráfico que pode ficar interessante. A linha amarela aparenta marcar o passo da tendência.
“It is not the strongest of the species that survives, nor the most intelligent, but rather the one most adaptable to change.”
― Leon C. Megginson
― Leon C. Megginson
Re: Trading ideas.
BearManBull Escreveu:Os transístores actuais são de uma escala à volta dos 10nm (dependendo do tipo de memoria pode ser a relação de 1 bit para 1 transístor), as moléculas de ADN estão em torno de 1nm. Mesmo que se tenha uma relação 1bit para 1 molécula de ADN (A,C,T ou G) não sei ate que ponto vai ser tão revolucionário...
O ADN é uma estrutura quaternária (isto é, 2 bits por símbolo) e julgo que há aqui uma substancial confusão pois uma molécula de ADN não corresponde a um símbolo, mas uma cadeia de símbolos. Na prática não se consegue guardar 2 bits por símbolo em ADN mas algo menos dado que é preciso incorporar um código corrector de erros (ECC) para compensar os erros de escrita/leitura.
Edit: aqui ficam as medidas aproximadas disponíveis na literatura, cada par de bases (=1 simbolo ~= 2 bits) mede cerca de 0.34 nm; isto corresponde na prática a qualquer coisa na ordem de 5 a 6 bits por 1nm como limite teórico; em comparação com silício e em termos de densidade de informação por unidade de volume, estamos a falar de várias ordens de grandeza superior.
FLOP - Fundamental Laws Of Profit
1. Mais vale perder um ganho que ganhar uma perda, a menos que se cumpra a Segunda Lei.
2. A expectativa de ganho deve superar a expectativa de perda, onde a expectativa mede a
__.amplitude média do ganho/perda contra a respectiva probabilidade.
3. A Primeira Lei não é mesmo necessária mas com Três Leis isto fica definitivamente mais giro.
Quem está ligado:
Utilizadores a ver este Fórum: Bing [Bot], Google Adsense [Bot] e 134 visitantes