Абсолютно надежные IT-системы?

Очередное подтверждение тезиса...
Ранее было http://www.e1.ru/talk/forum/read.php?f=72&t=39309&...
(со ссылкой на источник http://www.finextra.com/fullstory.asp?id=17286)

И снова "вести с полей" о падении системы, сделанной одним из ведущих мировых разработчиков банковского ПО.
http://www.news.com.au/dailytelegraph/story/0,22049,22410493-5001024,00.html

ANZ internet banking crashes

By George Lekakis

September 13, 2007 12:00am

A SOFTWARE glitch yesterday paralysed ANZ's online banking service, leaving up to 1 million customers across the country unable to pay bills and transfer money between accounts.


The service was out of action for almost 11 hours from 7am when a software program that tracks payments activities of customers began to malfunction.
Both personal and business customers were affected by the outage.
The meltdown of the ANZ site is the latest in a string of internet service breakdowns at leading Australian banks in the past month.
Last week all of Westpac's online banking, broking and wealth management platforms were out of action for almost two days.
It was the second time in a month that Westpac's online systems were forced offline.
In early August, Commonwealth Bank's CommSee and CommBiz platforms were thrown into disarray after an upgrade program wrought havoc with services.
The problems, which persisted for a week, forced the CBA to advise online business clients to refrain from using the internet service.
ANZ's problems yesterday were less severe in that customers were still able to access information on their accounts and transfer funds via phone banking.
ANZ spokeswoman Mairi Barton apologised to customers left stranded on the internet.
"It's frustrating that this has happened and we owe our customers an apology for the inconvenience we have caused them today," she said.
"This was a technical issue which was caused when an auditing tool reached its threshold and we are currently investigating why this mechanism did not reset."
ANZ's internet banking service runs on Finacle software developed by Infosys.
Over the past decade, outgoing chief executive John McFarlane has aimed to position ANZ as the country's leading online bank.
0
Neo™
Не бывает абсолютно надежных систем. Бывает грамотное резервное копирование и инцидент-менеджмент.
2 / 0
Cybervlad
От пользователя Neo™

Угу. Дядюшка Шнайер тоже самое говорит применительно к безопасности:

От пользователя Bruce Schneier
It's all backward. Insecurity is the norm. If any system is ever built completely vulnerability-free, it'll be the first time in the history of mankind. It's not a good bet.
0
От пользователя Neo™
.... и инцидент-менеджмент.

Еще одно умное слово из западного лексикона для отмазки в случае косяков и выбивания денег под это дело
2 / 0
Neo™
От пользователя hanyga
Еще одно умное слово из западного лексикона для отмазки в случае косяков и выбивания денег под это дело


:-)

Инцидент-менеджмент подразумевает в том числе прозрачный и адекватный мониторинг причин возникновения инцидента и предпринимаемых корректирующих действий. ;-)

А насчет денег — это лишь некий свод обязательных к исполнению правил и процедур, который можно организовать практически на любых, уже доступных, ресурсах.

Вы хотите поговорить об этом? ;-)
0
От пользователя Neo™
Бывает грамотное резервное копирование и инцидент-менеджмент.

бывают системные проблемы и много еще чего. и инцидент менеджемент (я понимаю как классический SD) никоим образом не влияет на надежность (!) системы.
0
Neo™
От пользователя Levis.
и инцидент менеджемент (я понимаю как классический SD) никоим образом не влияет на надежность (!) системы.


Что понимается под надежностью системы? Непрерывность сервиса входит в это понятие?

И классический инцидент-менеджмент — это не только устранение сбоев, но и текущая поддержка.
0
От пользователя Neo™
Что понимается под надежностью системы?

комплексное понятие.
От пользователя Neo™
Непрерывность сервиса входит в это понятие

да.
От пользователя Neo™
И классический инцидент-менеджмент — это не только устранение сбоев, но и текущая поддержка.

"Управление инцидентами" - входят в группу процессов "Поддержка услуг (Service Support)". На _надежность_ самой системы это вообще никак не влияет. Ведь если не работает у одного человека на компе (инцидент), из за неполадках на сетевой плате (причина) никак не влияет на надежность самой системы (допустим электронной почты).
ну и другой пример.
есть у нас бочка в которой в одном и том же месте "прорывает", так как заплатки фигового качества. Так вот цель инцидент менеджемента (в классическом понимание) оперативное устранение пробоины. И то что эта пробоину наверняка скоро опять прорвет, и необходимость сменить в итоге "заплату" на более "прочную" не входит в этот поцесс...
0
Neo™
От пользователя Levis.
Ведь если не работает у одного человека на компе (инцидент), из за неполадках на сетевой плате (причина) никак не влияет на надежность самой системы (допустим электронной почты).


А если неисправная сетевая плата находится на почтовом сервере? Да еще без резервирования? Снизится ли надежность системы при несвоевременном устранении инцидента?


От пользователя Levis.
есть у нас бочка в которой в одном и том же месте "прорывает", так как заплатки фигового качества. Так вот цель инцидент менеджемента (в классическом понимание) оперативное устранение пробоины. И то что эта пробоину наверняка скоро опять прорвет, и необходимость сменить в итоге "заплату" на более "прочную" не входит в этот поцесс...


«Заплатки фигового качества» — это всего лишь work around. Но цель инцидент-менеджмента отнюдь не обходное решение. Это лишь один из путей, когда время устранения критичнее надежности. Инцидент должен быть устранен в корне.
0
От пользователя Neo™
А если неисправная сетевая плата находится на почтовом сервере? Да еще без резервирования? Снизится ли надежность системы при несвоевременном устранении инцидента?

еще раз попытаюсь сформулировать. Инцидент менеджемент - это упорядоченая и максимально быстрая _реакция-решение_ на инцидент-проблему. А не обеспечение _надежности_ предоставления услуги.
От пользователя Neo™
Инцидент должен быть устранен в корне.

на сколько я помню устранение корневой (системной) ошибки - цель другого процесса - управление проблемами. Еще раз хочу уточнить оба эти процесса (проблемы и инциденты) относятся к группе процессов "Поддержка услуг". Как мне кажется обеспечение надежности более подходит к другой группе процессов - "Предоставление услуг".

[Сообщение изменено пользователем 14.09.2007 15:27]
0
резюмирую:
От пользователя Neo™
надежностью системы

обеспечивается сколько не:
От пользователя Neo™
грамотное резервное копирование и инцидент-менеджмент.

а другими мероприятиями (в терминологии itil процессами Availability, Capacity, Continuity Management).
0
Neo™
От пользователя Levis.
еще раз попытаюсь сформулировать. Инцидент менеджемент - это упорядоченая и максимально быстрая _реакция-решение_ на инцидент-проблему. А не обеспечение _надежности_ предоставления услуги.


Я так и не понял определения надежности. Надежность информационной системы обеспечивается в т.ч. максимально быстрым и качественным решением инцидентов. Вообще систему рассматривать некорректно, нужно рассматривать услугу, которую предоставляет использование данной системы.


От пользователя Levis.
на сколько я помню устранение корневой (системной) ошибки - цель другого процесса - управление проблемами. Еще раз хочу уточнить оба эти процесса (проблемы и инциденты) относятся к группе процессов "Поддержка услуг". Как мне кажется обеспечение надежности более подходит к другой группе процессов - "Предоставление услуг".


Надежность сервиса обеспечивает весь комплекс процессов. От решения инцидентов до резервирования мощностей.

От пользователя Levis.
а другими мероприятиями (в терминологии itil процессами Availability, Capacity, Continuity Management).


Не согласен. И они тоже обеспечивают.


Все упирается в разное понимание надежности системы. Я исхожу из того, что абсолютно надежных систем (беспрерывная работа сервиса) не существует. Даже на атомных станциях.
0
От пользователя Neo™
Не согласен. И они тоже обеспечивают.

этот процесс и это действие опосредовано участвуют в обеспечении надежности. Они не самые основные инструменты для обеспечения надежности.
От пользователя Neo™
Я исхожу из того, что абсолютно надежных систем (беспрерывная работа сервиса) не существует. Даже на атомных станциях.

абсолютной надежности не существует. вся наша жизнь - вероятность. Просто для того чтобы добится хотя бы 99% надежности (то есть функционирование на протяжении 99% согласованого времени, с 99% уровнем сервиса) мероприятия (решение инцидентов и процедура резервного копирования) состовляют лишь малую часть. Я собственно только это и хотел сказать...
0
Neo™
От пользователя Levis.
абсолютной надежности не существует. вся наша жизнь - вероятность. Просто для того чтобы добится хотя бы 99% надежности (то есть функционирование на протяжении 99% согласованого времени, с 99% уровнем сервиса) мероприятия (решение инцидентов и процедура резервного копирования) состовляют лишь малую часть. Я собственно только это и хотел сказать...


Согласен. :-) Я их упомянул лишь потому, что они, как правило, присутствуют в том или ином виде. А вот управление непрерывностью и доступностью — далеко не всегда.
0
Axxe
От пользователя Levis.
Как мне кажется обеспечение надежности более подходит к другой группе процессов - "Предоставление услуг".

абсолютно верно.

От пользователя Levis.
а другими мероприятиями (в терминологии itil процессами Availability, Capacity, Continuity Management).

и всё же в itil тема itscm раскрыта однобоко. это всё таки IT-il в первую очередь, а business continuity mgmt понятие более широкое. да и занимался bcm прежде всего не ogc, а вот эти парни http://www.thebci.org/
0
От пользователя Axxe
а business continuity mgmt понятие более широкое. да и занимался bcm прежде всего не ogc, а вот эти парни http://www.thebci.org/

с этим я пока вообще не знаком :-)
0
Astron
из этой же серии:
http://www.lenta.ru/news/2007/09/15/panic/
Кстати, может приклеить сварху тему навроде
"Проблемные ситуации в банках России и мира",
и коллекционировать там подобные вещи. А их немало, глобус круглый. Думаю что само наличие подобной темы сверху снизит количество заявлений что "только в .... все через ж....".
Как считаете?
0
От пользователя Neo™
Инцидент-менеджмент подразумевает в том числе прозрачный и адекватный мониторинг причин возникновения инцидента и предпринимаемых корректирующих действий. ;-)

А насчет денег — это лишь некий свод обязательных к исполнению правил и процедур, который можно организовать практически на любых, уже доступных, ресурсах.

Вы хотите поговорить об этом? ;-)


Поговорить можно, но если изначально понимать суть вопроса. В вашем понимании его я не уверен.

Насчет доступных ресурсов. Вы из тех, кто любит сваливать на одного человека должностные обязанности троих сотрудников ради экономии денег? Вы понимаете что такое ресурс? Ресуры бывают невосполнимые. Например, время...

Еще раз вам повторяю про инцедент-менеджмент. Это не более чем миф, высосанный из пальца, это демагогия.
0
Cybervlad
От пользователя Astron
Как считаете?

Поддерживаем ;-)
0
Дон Карлос
От пользователя Astron

От пользователя Cybervlad

напоминает старое СОВЕТСКОЕ, "а у вас негров вешают" :-d
0
Авторизуйтесь, чтобы принять участие в дискуссии.