关于expdp任务异常的处理案例详析
前言
本文主要介绍了关于expdp任务异常处理的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧
环境:AIX6.1+Oracle10.2.0.4
现象:在XTTS迁移测试阶段,遇到执行几个expdp的导出任务,迟迟没有返回任何信息,对应日志无任何输出,查看任务状态:
SQL> setlines300 colOWNER_NAMEfora10 colOPERATIONfora15 colJOB_MODEfora20 colSTATEfora15 select*fromdba_datapump_jobs; OWNER_NAMEJOB_NAMEOPERATIONJOB_MODESTATEDEGREEATTACHED_SESSIONSDATAPUMP_SESSIONS -------------------------------------------------------------------------------------------------------------------------------------- SYSSYS_EXPORT_TRANSPORTABLE_01EXPORTTRANSPORTABLEDEFINING101 SYSSYS_EXPORT_TRANSPORTABLE_02EXPORTTRANSPORTABLEDEFINING112 SYSSYS_EXPORT_TRANSPORTABLE_03EXPORTTRANSPORTABLEDEFINING112 SYSSYS_EXPORT_SCHEMA_01EXPORTSCHEMADEFINING112 SYSSYS_EXPORT_TRANSPORTABLE_04EXPORTTRANSPORTABLEDEFINING112 SYSSYS_EXPORT_SCHEMA_02EXPORTSCHEMADEFINING112 6rowsselected.
可以看到所有的expdp导出任务的STATE都停留在DEFINING状态。
1.牛刀小试清异常
先强制杀掉后台执行的所有expdp任务:
ps-ef|grepexpdp|grep-vgrep|awk'{print$2}'|xargskill-9
然后尝试删除这些表(其实应该在notrunning状态下删除)
select'droptable'||OWNER_NAME||'.'||JOB_NAME||'purge;'fromdba_datapump_jobswhereSTATE='NOTRUNNING'; droptablesys.SYS_EXPORT_TRANSPORTABLE_01purge; ..
可这样是没有作用的,查询结果不变。
甚至尝试正常shutdownimmediate停止数据库,也无法成功,告警日志看到有活动调用:
ThuNov115:14:242018 Activecallforprocess4522064user'oracle'program'oracle@localhost(DM00)' Activecallforprocess4456536user'oracle'program'oracle@localhost(DM01)' Activecallforprocess10027180user'oracle'program'oracle@localhost(DM02)' Activecallforprocess7340140user'oracle'program'oracle@localhost(DM03)' Activecallforprocess6291888user'oracle'program'oracle@localhost(DM04)' Activecallforprocess8126596user'oracle'program'oracle@localhost(DM05)' SHUTDOWN:waitingforactivecallstocomplete.
发现这些进程的id都对应了ora_dm的进程:
$ps-ef|grepora_dm oracle44565361017:00:09-0:00ora_dm01_xxxxdb oracle45220641016:50:57-0:00ora_dm00_xxxxdb oracle73401401014:06:07-0:00ora_dm03_xxxxdb oracle81265961014:35:03-0:00ora_dm05_xxxxdb oracle100271801013:55:08-0:00ora_dm02_xxxxdb oracle62918881014:31:17-0:00ora_dm04_xxxxdb oracle73404328388786015:22:59pts/40:00grepora_dm
实际上,这就是expdp任务的相关进程,强制杀掉这些进程:
ps-ef|grepora_dm|grep-vgrep|awk'{print$2}'|xargskill-9
之后数据库关闭成功:
ThuNov115:24:372018 Alldispatchersandsharedserversshutdown ThuNov115:24:372018 ALTERDATABASECLOSENORMAL
启动数据库后,再次查询发现已经成功清理:
SQL> setlines300 colOWNER_NAMEfora10 colOPERATIONfora15 colJOB_MODEfora20 colSTATEfora15 select*fromdba_datapump_jobs; norowsselected
小结:数据泵任务与ora_dm进程相关;如果数据泵任务发生异常,但任务并没有退出的情况,需要同时杀掉这类进程(杀掉后状态就会变为NOTRUNNING)。关库不是必须的,只是演示此时正常关闭被阻塞的场景。这也能说明为什么要保证在NOTRUNNING状态下才可以清理。
2.追本溯源查MOS
上面的步骤只是清理了异常的数据泵任务,但没有解决问题,再次后台执行备份任务依然会重现故障:
nohupshexpdp_xtts.sh&
$ps-ef|grepexpdp oracle66849148061208015:30:07pts/20:00grepexpdp oracle71434828061208015:30:03pts/20:00shexpdp_xtts.sh oracle66850967143482015:30:03pts/20:00expdp'/assysdba'parfile=expdp_xtts.par $ps-ef|grepora_dm oracle76023088061208015:30:10pts/20:00grepora_dm oracle39979641115:30:05-0:00ora_dm00_xxxxdb $
此时查询dba_datapump_jobs,state依然一直是defining状态:
OWNER_NAMEJOB_NAMEOPERATIONJOB_MODESTATEDEGREEATTACHED_SESSIONSDATAPUMP_SESSIONS --------------------------------------------------------------------------------------------------------------------------------------------------------------- SYSSYS_EXPORT_TRANSPORTABLE_01EXPORTTRANSPORTABLEDEFINING112
其他的导出任务都一样,不再赘述。
为了方便测试,写一个简单的单表expdp导出,现象也一样。
expdp\'/assysdba\'directory=XTTStables=query.testdumpfile=query_test.dmplogfile=query_test.log
根据故障现象,用如下关键字在MOS中搜索:expdpstateDEFINING,匹配到文档:
DataPumpExport/ImportHangsWith"DEFINING"StatusWhenUsingADirectoryOnNFSFilesystem(文档ID2262196.1)
正好这次测试是在NFS文件系统上,MOS建议移动到本地文件系统导出。
这次再将expdp进程全部杀掉:
ps-ef|grepora_dm|grep-vgrep|awk'{print$2}'|xargskill-9 ps-ef|grepexpdp|grep-vgrep|awk'{print$2}'|xargskill-9
此时查询dba_datapump_jobs:
OWNER_NAMEJOB_NAMEOPERATIONJOB_MODESTATEDEGREEATTACHED_SESSIONSDATAPUMP_SESSIONS ------------------------------------------------------------------------------------------------------------------------------------------------ SYSSYS_EXPORT_TABLE_04EXPORTTABLENOTRUNNING000 SYSSYS_EXPORT_SCHEMA_01EXPORTSCHEMANOTRUNNING000 SYSSYS_EXPORT_TABLE_02EXPORTTABLENOTRUNNING000 SYSSYS_EXPORT_TABLE_05EXPORTTABLENOTRUNNING000 SYSSYS_EXPORT_TABLE_03EXPORTTABLENOTRUNNING000 SYSSYS_EXPORT_TABLE_01EXPORTTABLENOTRUNNING000 SYSSYS_EXPORT_TRANSPORTABLE_01EXPORTTRANSPORTABLENOTRUNNING000 7rowsselected.
清理NOTRUNNING的master表:
select'droptable'||OWNER_NAME||'.'||JOB_NAME||'purge;'fromdba_datapump_jobswhereSTATE='NOTRUNNING'; --执行结果用来执行,再次查看结果为空: SQL>select*fromdba_datapump_jobs; norowsselected
按MOS建议,将导出任务移动到本地文件系统:
AIX源端导出XTTS源数据至源端/hxbak/xtts_exp目录中,而后copy至nfs共享存储/xtts/dmp中:
mkdir/hxbak/xtts_exp chownoracle:dba/hxbak/xtts_exp ls-ld/hxbak/xtts_exp select*fromdba_directories; createorreplacedirectoryXTTSas'/hxbak/xtts_exp';
此时测试expdp任务可正常运行:
$expdp\'/assysdba\'directory=XTTStables=query.testdumpfile=query_test.dmplogfile=query_test.log Export:Release10.2.0.4.0-64bitProductiononThursday,01November,201816:03:21 Copyright(c)2003,2007,Oracle.Allrightsreserved. Connectedto:OracleDatabase10gEnterpriseEditionRelease10.2.0.4.0-64bitProduction WiththePartitioning,OLAP,DataMiningandRealApplicationTestingoptions Starting"SYS"."SYS_EXPORT_TABLE_01":'/********ASSYSDBA'directory=XTTStables=query.testdumpfile=query_test.dmplogfile=query_test.log EstimateinprogressusingBLOCKSmethod... ProcessingobjecttypeTABLE_EXPORT/TABLE/TABLE_DATA TotalestimationusingBLOCKSmethod:8MB ProcessingobjecttypeTABLE_EXPORT/TABLE/TABLE ProcessingobjecttypeTABLE_EXPORT/TABLE/STATISTICS/TABLE_STATISTICS ..exported"QUERY"."TEST"6.743MB72593rows Mastertable"SYS"."SYS_EXPORT_TABLE_01"successfullyloaded/unloaded ****************************************************************************** DumpfilesetforSYS.SYS_EXPORT_TABLE_01is: /hxbak/xtts_exp/query_test.dmp Job"SYS"."SYS_EXPORT_TABLE_01"successfullycompletedat16:03:57 SQL>select*fromdba_datapump_jobs; OWNER_NAMEJOB_NAMEOPERATIONJOB_MODESTATEDEGREEATTACHED_SESSIONSDATAPUMP_SESSIONS ------------------------------------------------------------------------------------------------------------------------------------------------ SYSSYS_EXPORT_TABLE_01EXPORTTABLEEXECUTING113
再次导出其他元数据:
#expdp_xtts.sh(about5min) nohupshexpdp_xtts.sh& #expdp_xtts_other.sh(about5min) nohupshexpdp_xtts_other.sh& #expdp_tmp_table nohupshexpdp_tmp_table01.sh& nohupshexpdp_tmp_table02.sh& nohupshexpdp_tmp_table03.sh& nohupshexpdp_tmp_table04.sh&
最后将这些导出文件再移动到/xtts/dmp/下,供后续xtts测试目标端导入使用:
$pwd /hxbak/xtts_exp $cp-rp*/xtts/dmp/
目标端导入时只需要有读这些文件的权限,即可,实际测试恢复OK。
小结:
在自己的linux环境测试过是可以直接expdp到nfs文件系统的,AIX看来有区别,MOS的建议也只是一个workaround,但也能满足需求,毕竟元数据导出文件没多大。
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对毛票票的支持。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。