Aptos, блокчейн-платформа, известная своей приверженностью к бесперебойным транзакциям, недавно опубликовала отчет с подробным описанием инцидента в своей сети, который привел к задержкам транзакций.
Инцидент в сети Aptos: глубокое погружение в проблему и ее решение
Инцидент в сети Aptos произошел примерно в 16:15 по Гринвичу, но был успешно разрешен в 21:30 по гринвичу 18 октября.
Важно отметить, что было установлено, что инцидент в сети Aptos не был вызван перегрузкой транзакций, поскольку ни одна зафиксированная транзакция не была потеряна и форков не произошло. Вместо этого первопричина была прослежена до недетерминированного кода, который был введен в рамках изменения кода, ориентированного на производительность, 22 августа 2023 года.
Этот недетерминизм в коде стал очевиден, когда событие FeeStatement, введенное 16 октября, выявило проблему. Валидаторы в сети не смогли договориться о количестве газа, используемого при выполнении транзакций из-за этого недетерминированного кода. Команда выявила и устранила проблему, отменив изменение кода с августа.
Раскрываем секреты быстрого восстановления
Примечательно, что этот инцидент ознаменовал первую значительную задержку, возникшую в сети Aptos с момента запуска сети. Проблема не обнаруживалась ни во время какого предыдущего тестирования, в том числе в тестовой сети.
В ответ на инцидент в сети Aptos ее команда действовала быстро, выявив проблему, и операторы валидатора оперативно развернули правильное программное обеспечение для обеспечения стабильности сети.
Aptos сохраняет приверженность предоставлению передовых технологий в соответствии с рыночным спросом и возможностями облачной инфраструктуры. В 2023 году платформа выпустила семь крупных релизов и более 40 предложений по улучшению Aptos (AIPs).