本文目录一览:
- 1、压缩后的JS代码怎样解压缩?
- 2、iis。关于js调用并打开服务器上的word文档
- 3、jszip.js远程读取一个zip文件
- 4、js 如何读取xml文档内容
- 5、JQuery,JS 读取远程服务器的txt文件内容
- 6、nodejs实现一个word文档解析器思路详解
压缩后的JS代码怎样解压缩?
一般压缩都经过混淆,如果你看到变量名都是A,B,C,D之类的无规则的命名,那就是被混淆过的,一般来说也很难阅读,就算你 还原了格式。
如果是没有混淆的,你可以试试用js的格式化工具来重新格式化一下的,比如:
/* 美化:格式化代码,使之容易阅读 */
/* 净化:去掉代码中多余的注释、换行、空格等 */
/* 压缩:将代码压缩为更小体积,便于传输 */
/* 解压:将压缩后的代码转换为人可以阅读的格式 */
/* 混淆:将代码的中变量名简短化以减小体积,但可读性差,经混淆后的代码无法还原 */
/* 如果有用,请别忘了推荐给你的朋友: */
/* javascript在线美化、净化、压缩、解压: */
/* 以下是演示代码 */
var Inote = {};
Inote.JSTool = function(options) {
this.options = options || {};
};
Inote.JSTool.prototype = {
_name: 'Javascript工具',
_history: {
'v1.0': ['2011-01-18', 'javascript工具上线'],
'v1.1': ['2012-03-23', '增加混淆功能'],
'v1.2': ['2012-07-21', '升级美化功能引擎'],
'v1.3': ['2014-03-01', '升级解密功能,支持eval,window.eval,window["eval"]等的解密'],
'v1.4': ['2014-08-05', '升级混淆功能引擎'],
'v1.5': ['2014-08-09', '升级js压缩引擎'],
'v1.6': ['2015-04-11', '升级js混淆引擎']
},
options: {},
getName: function() {return this._name;},
getHistory: function() {
return this._history;}
};
var jstool = new Inote.JSTool();
iis。关于js调用并打开服务器上的word文档
1、word的打开是独占的,你不能同时对一个程序多次打开,所以理论上你的程序只能一个人用
2、这也不是js能做得了得,js控制不了服务器端
jszip.js远程读取一个zip文件
项目用到了jszip.js插件,用于在后台获取zip文件,前端解压并将模型进行在线显示.
官网
jszip的API说明为英文,例子其实也有些模糊.
远程加载一个文件, 使用官网的例子 :(自行观看);
这里作为笔记,主要是想说
promise.then(JSZip.loadAsync)
.then(function( zip ){returnzip.file("Hello.txt").async("string");
此处可以返回一个值,返回的值就是下一个.then的实参
})
这里的zip就是读取到的zip的数据,主要的属性诸如files就是zip中的文件,可以通过zip.file(filename)的形式将该文件对象进行存储,但是这里的文件对象其实是一个promise,当我们需要使用的时候可以通过.then 的形式使用
例如: pic.then(function(data){
//data就是该文件的数据,得到data后可以通过使用,这里就需要注意我们在存储的时候可以通过使用zip.file(filename).async(数据形式)来定义数据的存储形式,例如base64,blob,arraybuffer,其中base64是图片的存储格式,但是是没有前缀的,必须加相应的前缀才可以显示.data:image/png;base64;就可以直接赋值给image.src;
})
js 如何读取xml文档内容
先判断浏览器,然后读取xml数据就可以了
//判断不同的浏览器
function InitMf()
{
var mf_change=false;
try {
mf_change = new ActiveXObject("Msxml2.XMLHTTP");
} catch (e) {
try {
mf_change = new ActiveXObject("Microsoft.XMLHTTP");
} catch (E) {
mf_change = false;
}
}
if (!mf_change typeof XMLHttpRequest!='undefined') {
mf_change = new XMLHttpRequest();
}
return mf_change;
}
读取数据
var xmlHttp = InitMf();
var HTML = "";
//获得xml文件
xmlHttp.open("GET", xmlfile+"?"+Math.random(), true);
// 设置处理服务器的JS函数,函数又 xmlHttp.onreadystatechange来确定
xmlHttp.onreadystatechange=function() {
//alert(xmlHttp.status);
if (xmlHttp.readyState==4 xmlHttp.status==200) {
//ajax的XML传输的解析。获取解析的数据
var xml = xmlHttp.responseXML;
var node = xml.getElementsByTagName("item");//获得总结点
for(var i = 0 ; i node.length ; i++){
var str_t = "";
var str_d = "";
var menuHTML = "";
var elem = node[i];
//下面开始获得子节点数据,当然可以继续循环,获得更下面的节点
var title = elem.getElementsByTagName("title")[0].textContent != undefined ? elem.getElementsByTagName("title")[0].textContent : elem.getElementsByTagName("title")[0].text;
这些只是部分代码,不过已经足够了
JQuery,JS 读取远程服务器的txt文件内容
注意几点:
1 一个是端口号,注意你自己设置的是哪个端口号
2 第二个是要保证txt格式中的文件是json格式 ,不然会没有返回值。
3 不要在本地直接打开 ,放在本地服务器上,apache之类的
nodejs实现一个word文档解析器思路详解
之前项目里遇到一个需求,需要前端上传一个word文档,然后后端提取出该文档的指定位置的内容并保存。这里后端用的是nodejs,开始接到这个需求,发现无从下手,主要是没有处理过word这种类型的文档,怎么解析?
Excel倒是有相关的库可以用,而且很简单
思路
搜索了好一会儿,在npm上发现了一个叫做
adm-zip
的包,这个包可以解压缩word文档,原来word文档也是可以解压缩的,之前一直不知道,通过如下代码就可以将word文档解压缩,并进一步提取内容
var
admZip
=
require('adm-zip');
const
zip
=
new
admZip('test.docx');
//将该docx解压到指定文件夹result下
zip.extractAllTo("./result",
/*overwrite*/true);
首先我们新建一个docx文档,内容如下
然后运行上述代码进行解压缩,得到如下的文件,由下图可以看出生成了好几个文件夹,word的内容其实是在word文件夹里的document.xml文件内(这里解压缩后其实源文件还在,并没有消失)
进入word文件夹后的内容
我们继续打开document.xml文件来一探究竟里面到底是啥?注意要用浏览器直接打开,如果用ide打开显示出的所有内容都在一行,无法阅读!
上图只是word文档的一部分,会发现word文档内看着只有几段文字,但是xml中却是长篇大论,仔细分析下也很正常,xml全称可扩展标记语言,其被设计为传输和存储数据,它仅仅是一个纯文本的表示,而word中内容格式千变万化,肯定需要一种方法来有效描述这些内容的格式,因此采用了xml来描述
我们尝试一下将
测试文档
四个字加粗变色倾斜字体,如下图
然后再进行解压缩,得到docuemnt.xml并查看对应的内容,如下
这就很明显了,
w:b/
表示文字加粗,
w:i/
表示文字倾斜,
w:color
表示文字的颜色,所以这么4个字就需要这几行xml来描述,因此长篇大论的xml也就不足为奇
提取内容
上面说到了xml仅仅是一个文本的表示,我们可以用如下代码读取整个xml的内容,结果是一个
string
var
contentXml
=
zip.readAsText("word/document.xml");
接下来是重点,如何提取我们想要的内容呢,答案是正则表达式,首先我们得分析一下word文档的结构,word文档其实是由叫做
Paragraph
的段落所构成,在vb中可以很轻松的获取并修改段落,官网传送门点此
那么到底怎么样才是一个
Paragraph
呢,其实很简单,仔细观察word文档,见到下图中的小箭头了么,每个小箭头前面的内容就是一个段落,那么下图中一共有16个
Paragraph
,当然有些段落是空的,没有任何内容
我们再来研究xml的结构,收起展开的xml,如下图,发现
w:p/w:p
这么个标签就是表示的一个段落,中间还有些
w:p
藏在表格内,这么一看表格前面3个段落,后面3个段落,和上图是对应的
因此,
我们就可以提取出每个段落的文本并返回一个数组,每一项就是一个段落的内容
,这样就能够完整的解析出整个word的内容,关键在于如何提取每个
w:p
的内容,我们继续展开一个
w:p
进行观察,如下图,发现内容虽多,其实文本都保存在
w:t
中间,因此思路就清晰了,
首先用正则表达式提取出所有w:p的内容,再针对每个w:p的内容,进行进一步正则提取,提取出其里面所有w:t的内容,并拼接在一起构成一个段落的总内容
具体代码
下面是具体的提取代码
//参数是word文件名,第二个参数是回调表示解析完成
var
parser
=
function
parseWordDocument(absoluteWordPath,callback){
//返回内容的数组
var
resultList
=
[];
//如果文件存在
fs.exists(absoluteWordPath,
function(exists){
if(exists){
//解压缩
const
zip
=
new
admZip(absoluteWordPath);
//将document.xml(解压缩后得到的文件)读取为text内容
var
contentXml
=
zip.readAsText("word/document.xml");
//正则匹配出对应的w:p里面的内容,方法是先匹配w:p,再匹配里面的w:t,将匹配到的加起来即可
//注意?表示非贪婪模式(尽可能少匹配字符),否则只能匹配到一个w:p/w:p
var
matchedWP
=
contentXml.match(/w:p.*?.*?\/w:p/gi);
//继续匹配每个w:p/w:p里面的w:t,这里必须判断matchedWP存在否则报错
if(matchedWP){
matchedWP.forEach(function(wpItem){
//注意这里w:t的匹配,有可能是w:t
xml:space="preserve"这种格式,需要特殊处理
var
matchedWT
=
wpItem.match(/(w:t.*?\/w:t)|(w:t\s.[^]*?.*?\/w:t)/gi);
var
textContent
=
'';
if(matchedWT){
matchedWT.forEach(function(wtItem){
//如果不是w:t
xml:space="preserve"格式
if(wtItem.indexOf('xml:space')===-1){
textContent+=wtItem.slice(5,-6);
}else{
textContent+=wtItem.slice(26,-6);
}
});
resultList.push(textContent)
}
});
//解析完成
callback(resultList)
}
}else{
callback(resultList)
}
});
};
注意一下如果段落前有空格,那么
w:t
的格式是不同的,如下,多了这个space描述,所以需要特殊处理
代码量其实很少,关键在于正则的编写,上述docx文档提取后的输出结果如下
最后我把这个工具写成了一个npm包,地址点这里