diff --git a/sigs/datacompliance/README.md b/sigs/datacompliance/README.md deleted file mode 100644 index c8d528c3c1d593fa9922c7461c99c77e2e7105dd..0000000000000000000000000000000000000000 --- a/sigs/datacompliance/README.md +++ /dev/null @@ -1,44 +0,0 @@ -# MindSpore Data Compliance Interest Group (SIG) - -Data Compliance SIG aims to find out the risk of license compliance and help developers to use and sharing datasets legally. - -- List all the licenses of open datasets used in modelzoo - - If we do not know what license the data have, our use of data creates legal risks. Find out whether the data has a license by looking for the source of the data itself. If there is no license, users are not recommended to use it. For data with a license, we must clearly identify the license and record it onto website. - -- Categorize the dataset licenses into rights, obligations and limitations - - From a legal standpoint, depending on the nature of the data, collating and unifying data in databases could arguably have qualified (under certain legal systems) as copyright infringement or database right infringement (for jurisdictions such as the European Union where such a right exists). Without knowledgement of copyright law, people can hardly know which dataset can be used commercially. - - In cooperation with lawyers, we categorize the license clauses, for what we can do we call it rights. For what we have to do, we call it obligations, for what we do with restrictions, we call it a limitations. All analysis results will be output as a risk matrix. - -- Build a process to review the risk of license compliance - - After we have a team and rules, we have to set up a process to help our development team use the dataset more easily, some steps we should do before we release a datasets to our community: - - Do the datasets have a license or term of use? - - Which license or term of use do the datasets have? - - Is it non-commercial or research-use-only? - - Give the feedback to the data development team. - -- Form a standard license schema to resolve conceptual ambiguities - - As we gradually accumulate experience in data compliance, we will try to form a standard license language to help the entire industry reduce ambiguity. At the right time, we make it a standard. - -## SIG Leads - -- Gopi Krishnan Rajbahadur (Canada Queens University) -- Li Zi (Huawei) - -## Logistics - -- SIG leads will drive the meeting. -- Meeting announcement will be posted on our gitee channel: https://gitee.com/mindspore/community/tree/master/sigs/datacompliance -- Feedbacks and topic requests are welcomed by all. - -## Discussion - -- Documents and artifacts: https://gitee.com/mindspore/community/tree/master/sigs/datacompliance \ No newline at end of file diff --git a/sigs/datacompliance/dataset-reviewer/Dockerfile b/sigs/datacompliance/dataset-reviewer/Dockerfile new file mode 100644 index 0000000000000000000000000000000000000000..93ce5b6b36fd8cebfb4c75cf8b6141dfbfdff5a9 --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/Dockerfile @@ -0,0 +1,18 @@ +FROM python:3.8 + +RUN apt-get update +RUN apt-get install vim --yes + +WORKDIR /OpenDataology + +COPY . . + +# install env +RUN pip install -r requirements.txt --no-cache-dir + +RUN sed -i '5i from werkzeug.utils import cached_property' /usr/local/lib/python3.8/site-packages/werkzeug/__init__.py + + +EXPOSE 8080 + +CMD python app.py \ No newline at end of file diff --git a/sigs/datacompliance/dataset-reviewer/LICENSE b/sigs/datacompliance/dataset-reviewer/LICENSE new file mode 100644 index 0000000000000000000000000000000000000000..261eeb9e9f8b2b4b0d119366dda99c6fd7d35c64 --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/LICENSE @@ -0,0 +1,201 @@ + Apache License + Version 2.0, January 2004 + http://www.apache.org/licenses/ + + TERMS AND CONDITIONS FOR USE, REPRODUCTION, AND DISTRIBUTION + + 1. Definitions. + + "License" shall mean the terms and conditions for use, reproduction, + and distribution as defined by Sections 1 through 9 of this document. + + "Licensor" shall mean the copyright owner or entity authorized by + the copyright owner that is granting the License. + + "Legal Entity" shall mean the union of the acting entity and all + other entities that control, are controlled by, or are under common + control with that entity. For the purposes of this definition, + "control" means (i) the power, direct or indirect, to cause the + direction or management of such entity, whether by contract or + otherwise, or (ii) ownership of fifty percent (50%) or more of the + outstanding shares, or (iii) beneficial ownership of such entity. + + "You" (or "Your") shall mean an individual or Legal Entity + exercising permissions granted by this License. + + "Source" form shall mean the preferred form for making modifications, + including but not limited to software source code, documentation + source, and configuration files. + + "Object" form shall mean any form resulting from mechanical + transformation or translation of a Source form, including but + not limited to compiled object code, generated documentation, + and conversions to other media types. + + "Work" shall mean the work of authorship, whether in Source or + Object form, made available under the License, as indicated by a + copyright notice that is included in or attached to the work + (an example is provided in the Appendix below). + + "Derivative Works" shall mean any work, whether in Source or Object + form, that is based on (or derived from) the Work and for which the + editorial revisions, annotations, elaborations, or other modifications + represent, as a whole, an original work of authorship. For the purposes + of this License, Derivative Works shall not include works that remain + separable from, or merely link (or bind by name) to the interfaces of, + the Work and Derivative Works thereof. + + "Contribution" shall mean any work of authorship, including + the original version of the Work and any modifications or additions + to that Work or Derivative Works thereof, that is intentionally + submitted to Licensor for inclusion in the Work by the copyright owner + or by an individual or Legal Entity authorized to submit on behalf of + the copyright owner. For the purposes of this definition, "submitted" + means any form of electronic, verbal, or written communication sent + to the Licensor or its representatives, including but not limited to + communication on electronic mailing lists, source code control systems, + and issue tracking systems that are managed by, or on behalf of, the + Licensor for the purpose of discussing and improving the Work, but + excluding communication that is conspicuously marked or otherwise + designated in writing by the copyright owner as "Not a Contribution." + + "Contributor" shall mean Licensor and any individual or Legal Entity + on behalf of whom a Contribution has been received by Licensor and + subsequently incorporated within the Work. + + 2. Grant of Copyright License. Subject to the terms and conditions of + this License, each Contributor hereby grants to You a perpetual, + worldwide, non-exclusive, no-charge, royalty-free, irrevocable + copyright license to reproduce, prepare Derivative Works of, + publicly display, publicly perform, sublicense, and distribute the + Work and such Derivative Works in Source or Object form. + + 3. Grant of Patent License. Subject to the terms and conditions of + this License, each Contributor hereby grants to You a perpetual, + worldwide, non-exclusive, no-charge, royalty-free, irrevocable + (except as stated in this section) patent license to make, have made, + use, offer to sell, sell, import, and otherwise transfer the Work, + where such license applies only to those patent claims licensable + by such Contributor that are necessarily infringed by their + Contribution(s) alone or by combination of their Contribution(s) + with the Work to which such Contribution(s) was submitted. If You + institute patent litigation against any entity (including a + cross-claim or counterclaim in a lawsuit) alleging that the Work + or a Contribution incorporated within the Work constitutes direct + or contributory patent infringement, then any patent licenses + granted to You under this License for that Work shall terminate + as of the date such litigation is filed. + + 4. Redistribution. You may reproduce and distribute copies of the + Work or Derivative Works thereof in any medium, with or without + modifications, and in Source or Object form, provided that You + meet the following conditions: + + (a) You must give any other recipients of the Work or + Derivative Works a copy of this License; and + + (b) You must cause any modified files to carry prominent notices + stating that You changed the files; and + + (c) You must retain, in the Source form of any Derivative Works + that You distribute, all copyright, patent, trademark, and + attribution notices from the Source form of the Work, + excluding those notices that do not pertain to any part of + the Derivative Works; and + + (d) If the Work includes a "NOTICE" text file as part of its + distribution, then any Derivative Works that You distribute must + include a readable copy of the attribution notices contained + within such NOTICE file, excluding those notices that do not + pertain to any part of the Derivative Works, in at least one + of the following places: within a NOTICE text file distributed + as part of the Derivative Works; within the Source form or + documentation, if provided along with the Derivative Works; or, + within a display generated by the Derivative Works, if and + wherever such third-party notices normally appear. The contents + of the NOTICE file are for informational purposes only and + do not modify the License. You may add Your own attribution + notices within Derivative Works that You distribute, alongside + or as an addendum to the NOTICE text from the Work, provided + that such additional attribution notices cannot be construed + as modifying the License. + + You may add Your own copyright statement to Your modifications and + may provide additional or different license terms and conditions + for use, reproduction, or distribution of Your modifications, or + for any such Derivative Works as a whole, provided Your use, + reproduction, and distribution of the Work otherwise complies with + the conditions stated in this License. + + 5. Submission of Contributions. Unless You explicitly state otherwise, + any Contribution intentionally submitted for inclusion in the Work + by You to the Licensor shall be under the terms and conditions of + this License, without any additional terms or conditions. + Notwithstanding the above, nothing herein shall supersede or modify + the terms of any separate license agreement you may have executed + with Licensor regarding such Contributions. + + 6. Trademarks. This License does not grant permission to use the trade + names, trademarks, service marks, or product names of the Licensor, + except as required for reasonable and customary use in describing the + origin of the Work and reproducing the content of the NOTICE file. + + 7. Disclaimer of Warranty. Unless required by applicable law or + agreed to in writing, Licensor provides the Work (and each + Contributor provides its Contributions) on an "AS IS" BASIS, + WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or + implied, including, without limitation, any warranties or conditions + of TITLE, NON-INFRINGEMENT, MERCHANTABILITY, or FITNESS FOR A + PARTICULAR PURPOSE. You are solely responsible for determining the + appropriateness of using or redistributing the Work and assume any + risks associated with Your exercise of permissions under this License. + + 8. Limitation of Liability. In no event and under no legal theory, + whether in tort (including negligence), contract, or otherwise, + unless required by applicable law (such as deliberate and grossly + negligent acts) or agreed to in writing, shall any Contributor be + liable to You for damages, including any direct, indirect, special, + incidental, or consequential damages of any character arising as a + result of this License or out of the use or inability to use the + Work (including but not limited to damages for loss of goodwill, + work stoppage, computer failure or malfunction, or any and all + other commercial damages or losses), even if such Contributor + has been advised of the possibility of such damages. + + 9. Accepting Warranty or Additional Liability. While redistributing + the Work or Derivative Works thereof, You may choose to offer, + and charge a fee for, acceptance of support, warranty, indemnity, + or other liability obligations and/or rights consistent with this + License. However, in accepting such obligations, You may act only + on Your own behalf and on Your sole responsibility, not on behalf + of any other Contributor, and only if You agree to indemnify, + defend, and hold each Contributor harmless for any liability + incurred by, or claims asserted against, such Contributor by reason + of your accepting any such warranty or additional liability. + + END OF TERMS AND CONDITIONS + + APPENDIX: How to apply the Apache License to your work. + + To apply the Apache License to your work, attach the following + boilerplate notice, with the fields enclosed by brackets "[]" + replaced with your own identifying information. (Don't include + the brackets!) The text should be enclosed in the appropriate + comment syntax for the file format. We also recommend that a + file or class name and description of purpose be included on the + same "printed page" as the copyright notice for easier + identification within third-party archives. + + Copyright [yyyy] [name of copyright owner] + + Licensed under the Apache License, Version 2.0 (the "License"); + you may not use this file except in compliance with the License. + You may obtain a copy of the License at + + http://www.apache.org/licenses/LICENSE-2.0 + + Unless required by applicable law or agreed to in writing, software + distributed under the License is distributed on an "AS IS" BASIS, + WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. + See the License for the specific language governing permissions and + limitations under the License. diff --git a/sigs/datacompliance/dataset-reviewer/README.md b/sigs/datacompliance/dataset-reviewer/README.md new file mode 100644 index 0000000000000000000000000000000000000000..922003e770dbaf8414ab2410080fc74d4893c06f --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/README.md @@ -0,0 +1,48 @@ +# Env Installation + +## Option 1. Run with docker + k8s + +```sh +cd ServiceSet +docker build -t docker_account/service-set:0.1 ./ --no-cache +docker run -it --name service-set -p 9216:8080 quzicheng/service-set:0.1 +``` + +## Option 2. Install the env and start the service locally + +```sh +cd ServiceSet +sudo apt update +pip3 install -r requirements.txt # Based on Python 3.8.0 +python3 app.py +``` + +If this error occurs ```ImportError: cannot import name 'cached_property' from 'werkzeug'```, please import ```cached_property``` in ```werkzeug```. + +Add the import in ```werkzeug/__init__.py``` as followings: + +![werkzeug](readme_src/werkzeug1.png) + +![werkzeug](readme_src/werkzeug2.png) + +```sh +# This path depends on the actually path of your file, please check the prompt in the ImportError. +vim /absolute_path/werkzeug/__init__.py +``` + +```py +from werkzeug.utils import cached_property +``` + +```sh +# general path reference for werkzeug/__init__.py +The file path on CentOS:/usr/local/lib/python3.8/site-packages/werkzeug/__init__.py +The file path on Unbutu:/usr/local/lib/python3.8/dist-packages/werkzeug/__init__.py +The file path on MacOS:/usr/local/lib/python3.8/site-packages/werkzeug/__init__.py +``` + +# The architecture for the OpenDataology backend. + +![hierarchical architecture](readme_src/hierarchical-architecture.png) + +The main development language is Python3.8.0,based on Linux, with Flask and MySQL adopted. \ No newline at end of file diff --git a/sigs/datacompliance/dataset-reviewer/app.py b/sigs/datacompliance/dataset-reviewer/app.py new file mode 100644 index 0000000000000000000000000000000000000000..4457b695e8a8d317b64b9265a7b52450872a4519 --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/app.py @@ -0,0 +1,17 @@ +from main import * + +# from flask_cors import CORS + +# Models in models are not initialized if they are not imported, because they are not imported into the main program +from main.model.db_models import * + +from main.api import blueprint + +# Get app via singleton to ensure this app is unique in this project. +app = SingletonApp() +app.register_blueprint(blueprint) + +# CORS(app, supports_credentials=True) + +if __name__ == '__main__': + app.run(host="0.0.0.0", port=8080) diff --git a/sigs/datacompliance/dataset-reviewer/k8s/deployment.yaml b/sigs/datacompliance/dataset-reviewer/k8s/deployment.yaml new file mode 100644 index 0000000000000000000000000000000000000000..08443aa649801e0fa86f06246395ee07a9d8925c --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/k8s/deployment.yaml @@ -0,0 +1,18 @@ +apiVersion: apps/v1 +kind: Deployment +metadata: + name: review-backend-deployment +spec: + selector: + matchLabels: + app: review-backend + strategy: + type: Recreate + template: + metadata: + labels: + app: review-backend + spec: + containers: + - image: quzicheng/review-backend:0.1 + name: review-backend-con diff --git a/sigs/datacompliance/dataset-reviewer/k8s/service.yaml b/sigs/datacompliance/dataset-reviewer/k8s/service.yaml new file mode 100644 index 0000000000000000000000000000000000000000..307ec9aa2647e917562d006cbf86c55500819873 --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/k8s/service.yaml @@ -0,0 +1,15 @@ +apiVersion: v1 +kind: Service +metadata: + name: review-backend-service + labels: + app: review-backend +spec: + type: NodePort + selector: + app: review-backend + ports: + - protocol : TCP + nodePort: 30901 + port: 8080 + targetPort: 8080 \ No newline at end of file diff --git a/sigs/datacompliance/dataset-reviewer/main/__init__.py b/sigs/datacompliance/dataset-reviewer/main/__init__.py new file mode 100644 index 0000000000000000000000000000000000000000..e1cef00a3fbd438a598f001096b4640c960d0587 --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/main/__init__.py @@ -0,0 +1,32 @@ +from flask import Flask +from flask_sqlalchemy import SQLAlchemy # Mapping to the database +from main.conf.db_conf import * + +from flask_cors import CORS + +# Generate a db instance and bind it to the app +db = SQLAlchemy(session_options={"autoflush": False}) + +sqlalchemy_db_uri = "mysql+pymysql://" + dbms_usr + ":" + \ + dbms_pwd + "@" + dbms_addr + ":" + dbms_port + "/" + dbms_db + + +class SingletonApp(object): + """ + Get the app in singleton mode to ensure that the app is unique throughout the project + """ + + def __new__(self): + if not hasattr(self, 'instance'): + self.instance = Flask("OpenDataology_Service_Toolset") + CORS(self.instance, supports_credentials=True) + self.instance.config['DEBUG'] = True + self.instance.config['SQLALCHEMY_DATABASE_URI'] = sqlalchemy_db_uri + self.instance.config['SQLALCHEMY_POOL_SIZE'] = 5 + self.instance.config['SQLALCHEMY_POOL_TIMEOUT'] = 10 + self.instance.config['SQLALCHEMY_POOL_RECYCLE'] = 10 + # Changes to the database are automatically tracked + self.instance.config['SQLALCHEMY_TRACK_MODIFICATIONS'] = True + # While initializing the app, bind the app to the DB instance + db.init_app(self.instance) + return self.instance # self.instance is the app diff --git a/sigs/datacompliance/dataset-reviewer/main/api.py b/sigs/datacompliance/dataset-reviewer/main/api.py new file mode 100644 index 0000000000000000000000000000000000000000..832ceb55db95d1ea75ae0afd9cb7a5ddb8f3ffbf --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/main/api.py @@ -0,0 +1,16 @@ +from flask import Blueprint +from flask_restplus import Api + +from main.controller.dataset_review import user_dataset_review_ns, auth_dataset_review_ns + + +blueprint = Blueprint("api", __name__) +api = Api( + blueprint, + version=0.1, + title="APIs for OpenDataology service toolset", + description="Welcome to the OpenDataology service backend API document!" +) + +api.add_namespace(user_dataset_review_ns, '/user/dataset_review') +api.add_namespace(auth_dataset_review_ns, '/auth/dataset_review') diff --git a/sigs/datacompliance/dataset-reviewer/main/conf/__init__.py b/sigs/datacompliance/dataset-reviewer/main/conf/__init__.py new file mode 100644 index 0000000000000000000000000000000000000000..e69de29bb2d1d6434b8b29ae775ad8c2e48c5391 diff --git a/sigs/datacompliance/dataset-reviewer/main/conf/db_conf_demo.py b/sigs/datacompliance/dataset-reviewer/main/conf/db_conf_demo.py new file mode 100644 index 0000000000000000000000000000000000000000..8a51e0890a33198b659c1dfd6beb942024309007 --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/main/conf/db_conf_demo.py @@ -0,0 +1,9 @@ +# Database Configuration +dbms_server = "mysql" +dbms_driver = "pymysql" + +dbms_usr = "" +dbms_pwd = "" +dbms_addr = "" +dbms_port = "" +dbms_db = "" diff --git a/sigs/datacompliance/dataset-reviewer/main/controller/__init__.py b/sigs/datacompliance/dataset-reviewer/main/controller/__init__.py new file mode 100644 index 0000000000000000000000000000000000000000..e69de29bb2d1d6434b8b29ae775ad8c2e48c5391 diff --git a/sigs/datacompliance/dataset-reviewer/main/controller/dataset_review.py b/sigs/datacompliance/dataset-reviewer/main/controller/dataset_review.py new file mode 100644 index 0000000000000000000000000000000000000000..47d26baf63da46d593335d07df2968955253a02c --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/main/controller/dataset_review.py @@ -0,0 +1,514 @@ +from flask import request +from flask import json + +from flask import send_from_directory, make_response + +from flask_restplus import Resource +from flask_restplus import marshal + +from main.data_transform_object.dataset import DatasetObject +from main.data_transform_object.user import UserObject +from main.data_transform_object.admin import AdminObject + +from main.util.namespace import user_dataset_review_ns, auth_dataset_review_ns +from main.service import dataset_review + + +@user_dataset_review_ns.route("/review_upload") +class ReviewUpload(Resource): + @user_dataset_review_ns.expect(DatasetObject.dataset_review_list_req) + @user_dataset_review_ns.response(200, 'success', model=DatasetObject.dataset_is_reviewed_list_resp) + @user_dataset_review_ns.response(403, 'fail', model=DatasetObject.dataset_review_msg_resp) + def post(self): + """ + Upon uploading a dataset for review, the system will immediately provide conclusions for the portions of the + dataset that have already undergone review. Any sections that have not yet been audited will be placed + in a "pending_AIBOM" category, allowing the calling party to supplement + AIBOM (Artificial Intelligence Bill of Materials) information as necessary. + """ + dataset_review_list_req = json.loads( + request.data) # Parse request into a dictionary + + # Execute the specific method, and get the returned dictionary + user_id = dataset_review_list_req['user_id'] + dataset_review_list = dataset_review_list_req['dataset_review_list'] + response_dict = dataset_review.review_upload( + user_id, dataset_review_list) + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.dataset_is_reviewed_list_resp if status_code == 200 else DatasetObject.dataset_review_msg_resp + + return marshal(response_dict, model_ret), status_code + + +@user_dataset_review_ns.route("/review_upload_by_file") +class ReviewUploadByFile(Resource): + @user_dataset_review_ns.expect(DatasetObject.dataset_review_list_req) + @user_dataset_review_ns.response(200, 'success', model=DatasetObject.dataset_is_reviewed_list_resp) + @user_dataset_review_ns.response(403, 'fail', model=DatasetObject.dataset_review_msg_resp) + def post(self): + """ + The dataset review process involves batch uploading through files. It will promptly provide conclusions + for the portions of the dataset that have undergone review. Any sections that have not yet been assessed + will be categorized as "pending_AIBOM," allowing the calling party to add + AIBOM (Artificial Intelligence Bill of Materials) information when necessary. + """ + user_id = request.form.get("user_id") + dataset_review_list_req = request.files.get('dataset_review_list') + + dataset_review_list = dataset_review.file_convert_dataset( + user_id, dataset_review_list_req) + + if dataset_review_list['message'] == 'success': + dataset_review_list = dataset_review_list['notification'] + # Execute the specific method, and get the returned dictionary + response_dict = dataset_review.review_upload( + user_id, dataset_review_list) + else: + response_dict = dataset_review_list + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.dataset_is_reviewed_list_resp if status_code == 200 else DatasetObject.dataset_review_msg_resp + + return marshal(response_dict, model_ret), status_code + + +@user_dataset_review_ns.route("/pending_AIBOM") +class PendingAIBOM(Resource): + @user_dataset_review_ns.expect(UserObject.AIBOM_user) + @user_dataset_review_ns.response(200, 'success', model=DatasetObject.pending_aibom_list_resp) + @user_dataset_review_ns.response(403, 'fail', model=DatasetObject.dataset_review_msg_resp) + def get(self): + """ + Retrieve a list of datasets requiring AIBOM information supplementation using the provided user_id. + """ + user_id = int(request.args.get('user_id', '')) + + # Execute the specific method, and get the returned dictionary + response_dict = dataset_review.get_pending_aibom_by_user(user_id) + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.pending_aibom_list_resp if status_code == 200 else DatasetObject.dataset_review_msg_resp + + return marshal(response_dict, model_ret), status_code + + +@user_dataset_review_ns.route("/save_AIBOM") +class SaveAIBOM(Resource): + @user_dataset_review_ns.expect(DatasetObject.pending_aibom_list_req) + @user_dataset_review_ns.response(200, 'success', model=DatasetObject.dataset_review_msg_resp) + @user_dataset_review_ns.response(403, 'fail', model=DatasetObject.dataset_review_msg_resp) + def post(self): + """ + Temporarily store the AIBOM information supplemented by the given user_id. + """ + hashmap = json.loads(request.data) + pending_aibom_list = hashmap.get('pending_aibom_list', '') + + # Execute the specific method, and get the returned dictionary + response_dict = dataset_review.save_pending_aibom_list( + pending_aibom_list) + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.dataset_review_msg_resp + + return marshal(response_dict, model_ret), status_code + + +@user_dataset_review_ns.route("/submit_AIBOM") +class SubmitAIBOM(Resource): + @user_dataset_review_ns.expect(DatasetObject.pending_aibom_list_req) + @user_dataset_review_ns.response(200, 'success', model=DatasetObject.dataset_review_msg_resp) + @user_dataset_review_ns.response(403, 'fail', model=DatasetObject.pending_aibom_list_resp) + def post(self): + """ + Submit the AIBOM information supplemented by the provided user_id. + If required information is incorrectly formatted or missing, a corresponding dataset list will be returned. + The correct portions of datasets will be sent to the review side, and the "pending AIBOM" status will be removed. + Format check: name, location, originator, license_location, type, size, intended_use, and user_id cannot be empty. + The concluded_license and declared_license cannot be both empty simultaneously. + """ + hashmap = json.loads(request.data) + pending_aibom_list = hashmap.get('pending_aibom_list', '') + + # Execute the specific method, and get the returned dictionary + dataset_review.save_pending_aibom_list(pending_aibom_list) # 在提交前先临时保存 + response_dict = dataset_review.submit_pending_aibom_list( + pending_aibom_list) + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.dataset_review_msg_resp if status_code == 200 else DatasetObject.pending_aibom_list_resp + + return marshal(response_dict, model_ret), status_code + + +@user_dataset_review_ns.route("/remove_AIBOM") +class RemoveAIBOM(Resource): + @user_dataset_review_ns.expect(DatasetObject.dataset_state_rollback_req) + @user_dataset_review_ns.response(200, 'success', model=DatasetObject.dataset_review_msg_resp) + @user_dataset_review_ns.response(403, 'fail', model=DatasetObject.dataset_review_msg_resp) + def post(self): + """ + Allow users to choose to delete certain datasets while supplementing AIBOM information. + """ + hashmap = json.loads(request.data) + user_id = hashmap.get('user_id', "") + pending_aibom_ids = set(hashmap.get('pending_aibom_review_ids', '')) + + # Execute the specific method, and get the returned dictionary + response_dict = dataset_review.remove_pending_aibom_list( + user_id, pending_aibom_ids) + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.dataset_review_msg_resp + + return marshal(response_dict, model_ret), status_code + + +@user_dataset_review_ns.route("/get_license") +class GetLicense(Resource): + @user_dataset_review_ns.expect(DatasetObject.string_req) + @user_dataset_review_ns.response(200, 'success', model=DatasetObject.license_list_resp) + @user_dataset_review_ns.response(403, 'fail', model=DatasetObject.dataset_review_msg_resp) + def get(self): + """ + Retrieve a list of licenses that match the fuzzy query based on the provided text. + If no text is provided, the default behavior is to retrieve the complete list of licenses. + """ + text = request.args.get('text', '') + + # Execute the specific method, and get the returned dictionary + response_dict = dataset_review.get_dataset_license_list(text) + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.license_list_resp if status_code == 200 else DatasetObject.dataset_review_msg_resp + + return marshal(response_dict, model_ret), status_code + + +@auth_dataset_review_ns.route("/is_admin") +class IsAdmin(Resource): + @auth_dataset_review_ns.expect(AdminObject.Admin_user_req) + @auth_dataset_review_ns.response(200, 'success', model=DatasetObject.dataset_review_msg_resp) + @auth_dataset_review_ns.response(403, 'fail', model=DatasetObject.dataset_review_msg_resp) + def post(self): + """ + Check if the user is an admin. Return "success" if successful and "fail" if unsuccessful. + """ + hashmap = json.loads(request.data) + + user_id = hashmap.get('user_id', '') + account = hashmap.get('account', '') + + # Execute the specific method, and get the returned dictionary + response_dict = dataset_review.is_admin(user_id, account) + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.dataset_review_msg_resp + + return marshal(response_dict, model_ret), status_code + + +@auth_dataset_review_ns.route("/pending_review") +class PendingReview(Resource): + @auth_dataset_review_ns.expect(UserObject.AIBOM_user) + @auth_dataset_review_ns.response(200, 'success', model=DatasetObject.pending_review_list_resp) + @auth_dataset_review_ns.response(403, 'fail', model=DatasetObject.dataset_review_msg_resp) + def get(self): + """ + Retrieve datasets pending approval for the specified user_id. If no user_id is provided, retrieve all datasets pending approval. + """ + user_id = int(request.args.get('user_id', -1)) + + # Execute the specific method, and get the returned dictionary + response_dict = dataset_review.get_pending_review_list(user_id) + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.pending_review_list_resp if status_code == 200 else DatasetObject.dataset_review_msg_resp + + return marshal(response_dict, model_ret), status_code + + +@auth_dataset_review_ns.route("/save_review") +class SaveReview(Resource): + @auth_dataset_review_ns.expect(DatasetObject.pending_review_list_req) + @auth_dataset_review_ns.response(200, 'success', model=DatasetObject.dataset_review_msg_resp) + @auth_dataset_review_ns.response(403, 'fail', model=DatasetObject.dataset_review_msg_resp) + def post(self): + """ + Temporarily store the information filled out by the reviewer. + """ + hashmap = json.loads(request.data) + pending_review_list = hashmap.get('pending_review_list', '') + + # Execute the specific method, and get the returned dictionary + response_dict = dataset_review.save_pending_review_list( + pending_review_list) + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.dataset_review_msg_resp + + return marshal(response_dict, model_ret), status_code + + +@auth_dataset_review_ns.route("/reject_review") +class RejectReview(Resource): + @auth_dataset_review_ns.expect(DatasetObject.dataset_state_rollback_req) + @auth_dataset_review_ns.response(200, 'success', model=DatasetObject.pending_aibom_list_resp) + @auth_dataset_review_ns.response(403, 'fail', model=DatasetObject.dataset_review_msg_resp) + def post(self): + """ + If the reviewer determines that the AIBOM supplementary information is incomplete and decides to reject the review, + the status will be reverted from "pending review" back to "pending AIBOM." + The reviewer can also provide the user with feedback on the specific AIBOM issues related to the dataset. + """ + hashmap = json.loads(request.data) + user_id = hashmap.get('user_id', "") + pending_review_ids = hashmap.get('pending_aibom_review_ids', '') + rejection_notes = hashmap.get('rejection_notes', "") + + # Execute the specific method, and get the returned dictionary + response_dict = dataset_review.reject_review( + user_id, pending_review_ids, rejection_notes) + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.pending_aibom_list_resp if status_code == 200 else DatasetObject.dataset_review_msg_resp + + return marshal(response_dict, model_ret), status_code + + +@auth_dataset_review_ns.route("/submit_review") +class SubmitReview(Resource): + @auth_dataset_review_ns.expect(DatasetObject.pending_review_list_req) + @auth_dataset_review_ns.response(200, 'success', model=DatasetObject.dataset_review_msg_resp) + @auth_dataset_review_ns.response(403, 'fail', model=DatasetObject.pending_review_list_resp) + def post(self): + """ + Submit the reviewer's review information to transition the status from "pending_review" to "review_result." + """ + hashmap = json.loads(request.data) + pending_review_list = hashmap.get('pending_review_list', '') + + # Execute the specific method, and get the returned dictionary + dataset_review.save_pending_review_list( + pending_review_list) # 在提交前先临时保存 + response_dict = dataset_review.submit_pending_review_list( + pending_review_list) + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.dataset_review_msg_resp if status_code == 200 else DatasetObject.pending_review_list_resp + + return marshal(response_dict, model_ret), status_code + + +@auth_dataset_review_ns.route("/review_result") +class ReviewResult(Resource): + @auth_dataset_review_ns.expect(UserObject.AIBOM_user) + @auth_dataset_review_ns.response(200, 'success', model=DatasetObject.review_result_list_resp) + @auth_dataset_review_ns.response(403, 'fail', model=DatasetObject.dataset_review_msg_resp) + def get(self): + """ + Retrieve all datasets that have been successfully reviewed for the specified user_id. If no user_id is provided, + retrieve all datasets that have been approved. + """ + user_id = int(request.args.get('user_id', -1)) + + # Execute the specific method, and get the returned dictionary + response_dict = dataset_review.get_review_result_list(user_id) + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.review_result_list_resp if status_code == 200 else DatasetObject.dataset_review_msg_resp + + return marshal(response_dict, model_ret), status_code + + +@auth_dataset_review_ns.route("/review_result_download") +class ReviewResultDownload(Resource): + @auth_dataset_review_ns.expect(UserObject.AIBOM_user) + @auth_dataset_review_ns.response(403, 'fail', model=DatasetObject.dataset_review_msg_resp) + def post(self): + """ + Download all datasets that have been successfully reviewed for the specified user_id in CSV format. + If no user_id is provided, download all datasets that have been approved in CSV format by default. + """ + user_id = json.loads(request.data).get('user_id', -1) + user_id = -1 if user_id == "" or user_id is None else user_id + + # Execute the specific method, and get the returned dictionary + response_dict = dataset_review.get_review_result_list(user_id) + + if response_dict['message'] == 'success': + response_dict = dataset_review.review_result_download( + user_id, response_dict['review_result_list']) + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.review_result_list_resp if status_code == 200 else DatasetObject.dataset_review_msg_resp + + if status_code == 404: + return marshal(response_dict, model_ret), status_code + else: + res = make_response(send_from_directory( + response_dict['download_path'], response_dict['file_name'], as_attachment=True)) + res.headers["Cache-Control"] = "no_store" + res.headers["max-age"] = 1 + return res + + +@auth_dataset_review_ns.route("/review_result_search_for_name") +class ReviewResultSearchForName(Resource): + # @auth_dataset_review_ns.expect(UserObject.AIBOM_user) + @auth_dataset_review_ns.response(403, 'fail', model=DatasetObject.dataset_review_msg_resp) + def post(self): + """ + Searching review result by dataset similar name + """ + # user_id = json.loads(request.data).get('user_id', -1) + request_body_json = json.loads(request.data) + dataset_name = request_body_json.get('dataset_name', [""]) + # user_id = -1 if user_id == "" or user_id is None else user_id + + response_dict = dataset_review.get_review_result_list_for_dataset_name(dataset_name) + + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.review_result_list_resp if status_code == 200 else DatasetObject.dataset_review_msg_resp + + return marshal(response_dict, model_ret), status_code + # + # if status_code == 404: + # return marshal(response_dict, model_ret), status_code + # else: + # res = make_response(send_from_directory( + # response_dict['review_result_list'], response_dict['file_name'], as_attachment=True)) + # res.headers["Cache-Control"] = "no_store" + # res.headers["max-age"] = 1 + # return res + + +@auth_dataset_review_ns.route("/review_result_cur_row_download") +class ReviewResultDownloadForNames(Resource): + @auth_dataset_review_ns.response(403, 'fail', model=DatasetObject.dataset_review_msg_resp) + def post(self): + """ + Downloading one row review result that is you selected + """ + # user_id = json.loads(request.data).get('user_id', -1) + result_id = json.loads(request.data).get('result_id') + # user_id = -1 if user_id == "" or user_id is None else user_id + + # Execute the specific method, and get the returned dictionary + + response_dict = dataset_review.get_review_result_by_id(result_id) + if response_dict['message'] == 'success': + response_dict = dataset_review.review_result_download( + user_id="", review_result_list=response_dict['review_result_list']) + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.review_result_list_resp if status_code == 200 else DatasetObject.dataset_review_msg_resp + + if status_code == 404: + return marshal(response_dict, model_ret), status_code + else: + res = make_response(send_from_directory( + response_dict['download_path'], response_dict['file_name'], as_attachment=True)) + res.headers["Cache-Control"] = "no_store" + res.headers["max-age"] = 1 + return res + + +@auth_dataset_review_ns.route("/review_result_cur_search_download") +class ReviewResultDownloadForNames(Resource): + @auth_dataset_review_ns.response(403, 'fail', model=DatasetObject.dataset_review_msg_resp) + def post(self): + """ + Downloading current search review result by dataset similar name + """ + # user_id = json.loads(request.data).get('user_id', -1) + request_body_json = json.loads(request.data) + dataset_name = request_body_json.get('dataset_name', [""]) + # user_id = -1 if user_id == "" or user_id is None else user_id + + response_dict = dataset_review.get_review_result_list_for_dataset_name(dataset_name) + + status_code = 200 if response_dict['message'] == 'success' else 403 + + if response_dict['message'] == 'success': + response_dict = dataset_review.review_result_download( + user_id="", review_result_list=response_dict['review_result_list']) + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.review_result_list_resp if status_code == 200 else DatasetObject.dataset_review_msg_resp + + if status_code == 404: + return marshal(response_dict, model_ret), status_code + else: + res = make_response(send_from_directory( + response_dict['download_path'], response_dict['file_name'], as_attachment=True)) + res.headers["Cache-Control"] = "no_store" + res.headers["max-age"] = 1 + return res + + +@auth_dataset_review_ns.route("/license_upload_by_file") +class LicenseUploadByFile(Resource): + @auth_dataset_review_ns.expect(DatasetObject.dataset_license_list_req) + @auth_dataset_review_ns.response(200, 'success', model=DatasetObject.dataset_review_msg_resp) + @auth_dataset_review_ns.response(403, 'fail', model=DatasetObject.dataset_license_list_resp) + def post(self): + """ + Upload licenses in bulk through files. Existing licenses will not be duplicated and will be placed in the "fail" list, + while successful uploads will be placed in the "success" list. If all uploads are successful, + only a success message will be returned. + """ + user_id = request.form.get("user_id") + dataset_license_list_req = request.files.get('dataset_license_list') + + dataset_license_list_req = dataset_review.file_convert_license( + user_id, dataset_license_list_req) + + if dataset_license_list_req['message'] == 'success': + dataset_license_list = dataset_license_list_req['notification'] + # Execute the specific method, and get the returned dictionary + response_dict = dataset_review.license_upload( + user_id, dataset_license_list) + else: + response_dict = dataset_license_list_req + + # success or fail + status_code = 200 if response_dict['message'] == 'success' else 403 + + model_ret = DatasetObject.dataset_review_msg_resp if status_code == 200 else DatasetObject.dataset_license_list_resp + + return marshal(response_dict, model_ret), status_code diff --git a/sigs/datacompliance/dataset-reviewer/main/data_transform_object/__init__.py b/sigs/datacompliance/dataset-reviewer/main/data_transform_object/__init__.py new file mode 100644 index 0000000000000000000000000000000000000000..e69de29bb2d1d6434b8b29ae775ad8c2e48c5391 diff --git a/sigs/datacompliance/dataset-reviewer/main/data_transform_object/admin.py b/sigs/datacompliance/dataset-reviewer/main/data_transform_object/admin.py new file mode 100644 index 0000000000000000000000000000000000000000..b0db79e9acc43b6e47ca601cd9167bc377549778 --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/main/data_transform_object/admin.py @@ -0,0 +1,10 @@ +from flask_restplus import fields + +from main.util.namespace import user_dataset_review_ns + + +class AdminObject: + Admin_user_req = user_dataset_review_ns.model("Admin_user_req", { + 'user_id': fields.Integer(description='user id', required=True), + 'account': fields.String(description='user account', required=True) + }) diff --git a/sigs/datacompliance/dataset-reviewer/main/data_transform_object/dataset.py b/sigs/datacompliance/dataset-reviewer/main/data_transform_object/dataset.py new file mode 100644 index 0000000000000000000000000000000000000000..6092cbd8646b458f0922e737ac9561ed4965c079 --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/main/data_transform_object/dataset.py @@ -0,0 +1,167 @@ +from flask_restplus import fields + +from main.util.namespace import user_dataset_review_ns + + +class DatasetObject: + # General Message + dataset_review_msg_resp = user_dataset_review_ns.model("1. dataset_review_msg_resp", { + 'message': fields.String(description='Success or Fail'), + 'notification': fields.String(description='Customized notification') + }) + + # The original info about the single dataset + dataset_review_req = user_dataset_review_ns.model("2. dataset_review_req", { + 'name': fields.String(description='Dataset Name', required=True), + 'location': fields.String(description='Dataset official link', required=True), + 'originator': fields.String(description='Dataset Author', required=True) + }) + + # The AIBOM attributes of the single dataset + pending_aibom = user_dataset_review_ns.model("3. pending_aibom", { + 'id': fields.Integer(description='Dataset ID in table pending_aibom ,this id is required when you use pending_aibom in the request.', required=True), + # The AIBOM attributes + 'name': fields.String(description='Dataset Name', required=True), + 'location': fields.String(description='Dataset official link', required=True), + 'originator': fields.String(description='Dataset Author', required=True), + 'license_location': fields.String(description='Dataset link', required=True), + 'concluded_license': fields.String(description='License in SPDX license list'), + 'declared_license': fields.String(description='Customized license'), + 'type': fields.String(description='Dataset format,such as image、audio、video etc.', enum=['image', 'radio', 'video', 'binary', 'others'], required=True), + 'size': fields.String(description='Size of dataset', required=True), + 'intended_use': fields.String(description='The usage of dataset', required=True), + 'checksum': fields.String(description='Checksum'), + 'data_collection_process': fields.String(description='Process of data collection'), + 'known_biases': fields.Boolean(description='The dataset contains biases or not'), + 'sensitive_personal_information': fields.Boolean(description='The dataset contains personal info or not'), + 'offensive_content': fields.Boolean(description='The dataset contains offensive content or not'), + # User info + 'user_id': fields.Integer(description='The id of AIBOM author', required=True), + # Rejection remarks + 'rejection_notes': fields.String(description='Only used in pending_AIBOM or reject_review,when this AIBOM was rejected by reviewer.'), + }) + + # The review result of datasets + review_result = user_dataset_review_ns.model("4. review_result", { + 'id': fields.Integer(description='Dataset ID in table pending_aibom ,this id is required when you use pending_aibom in the request.', required=True), + # The AIBOM attributes + 'name': fields.String(description='Dataset Name', required=True), + 'location': fields.String(description='Dataset official link', required=True), + 'originator': fields.String(description='Dataset Author', required=True), + 'license_location': fields.String(description='Dataset link', required=True), + 'concluded_license': fields.String(description='License in SPDX license list'), + 'declared_license': fields.String(description='Customized license'), + 'type': fields.String(description='Dataset format,such as image、audio、video etc.', enum=['image', 'radio', 'video', 'binary', 'others'], required=True), + 'size': fields.String(description='Size of dataset', required=True), + 'intended_use': fields.String(description='The usage of dataset', required=True), + 'checksum': fields.String(description='Checksum'), + 'data_collection_process': fields.String(description='Process of data collection'), + 'known_biases': fields.Boolean(description='The dataset contains biases or not'), + 'sensitive_personal_information': fields.Boolean(description='The dataset contains personal info or not'), + 'offensive_content': fields.Boolean(description='The dataset contains offensive content or not'), + # User info + 'user_id': fields.Integer(description='The id of AIBOM author', required=True), + # Initial review comments + 'review_result_initial': fields.String(description='Initial review comments', required=True), + 'is_dataset_commercially_used_initial': fields.Boolean(description='The dataset can be used commercially or not', required=True), + 'is_dataset_commercially_distributed_initial': fields.Boolean(description='The dataset can be distributed commercially or not', required=True), + 'is_product_commercially_published_initial': fields.Boolean(description='The dataset can be integrated in commercial products or not', required=True), + 'right_initial': fields.String(description='Initial rights analysis'), + 'obligation_initial': fields.String(description='Initial obligations analysis'), + 'limitation_initial': fields.String(description='Initial limitations analysis'), + 'notes_initial': fields.String(description='Initial reviews'), + # Final review comments + 'review_result_final': fields.String(description='Final reviews', required=True), + 'is_dataset_commercially_used_final': fields.Boolean(description='The dataset can be used commercially or not', required=True), + 'is_dataset_commercially_distributed_final': fields.Boolean(description='The dataset can be distributed commercially or not', required=True), + 'is_product_commercially_published_final': fields.Boolean(description='The dataset can be integrated in commercial products or not', required=True), + 'right_final': fields.String(description='Final rights analysis'), + 'obligation_final': fields.String(description='Final obligations analysis'), + 'limitation_final': fields.String(description='Final limitations analysis'), + 'notes_final': fields.String(description='Final reviews'), + }) + + # The review notes of batch datasets + dataset_review_list_req = user_dataset_review_ns.model("5. dataset_review_list_req", { + 'user_id': fields.Integer(description='The id of AIBOM author', required=True), + 'dataset_review_list': fields.List(fields.Nested(dataset_review_req), description='The review notes of a single dataset', required=True) + }) + + # Batch datasets is reviwed or not + dataset_is_reviewed_list_resp = user_dataset_review_ns.model("6. dataset_is_reviewed_list_resp", { + 'review_result_list': fields.List(fields.Nested(review_result), description='The review notes of batch datasets'), + 'pending_aibom_list': fields.List(fields.Nested(pending_aibom), description='The AIBOMs of batch datasets'), + 'message': fields.String(description='Success or fail'), + 'notification': fields.String(description='Customized notification') + }) + + # Store the AIBOMs of batch datasets + pending_aibom_list_req = user_dataset_review_ns.model("7. pending_aibom_list_req", { + 'pending_aibom_list': fields.List(fields.Nested(pending_aibom), description='The AIBOMs of batch datasets', required=True) + }) + + # Return the AIBOMs of batch datasets + pending_aibom_list_resp = user_dataset_review_ns.model("8. pending_aibom_list_resp", { + 'pending_aibom_list': fields.List(fields.Nested(pending_aibom), description='The AIBOMs of batch datasets'), + 'message': fields.String(description='Success or fail'), + 'notification': fields.String(description='Customized notification') + }) + + # Revise the status,if pending AIBOM,delete it,if pending review,revise the pending AIBOM + dataset_state_rollback_req = user_dataset_review_ns.model("9. dataset_state_rollback_req", { + 'user_id': fields.Integer(description='The id of AIBOM author', required=True), + 'pending_aibom_review_ids': fields.List(fields.Integer, description='The dataset id in table pending_aibom or pending_review', required=True), + 'rejection_notes': fields.List(fields.String, description='The count of review notes,The count of rejection_notes <= The count of pending_aibom_review_ids') + }) + + # Store review notes of batch datasets + pending_review_list_req = user_dataset_review_ns.model("10. pending_review_list_req", { + 'pending_review_list': fields.List(fields.Nested(review_result), description='The review notes of batch datasets', required=True) + }) + + # Return review notes of batch datasets + pending_review_list_resp = user_dataset_review_ns.model("11. pending_review_list_resp", { + 'pending_review_list': fields.List(fields.Nested(review_result), description='The review notes of batch datasets'), + 'message': fields.String(description='Success or fail'), + 'notification': fields.String(description='Customized notification') + }) + + # Return final review notes of batch datasets + review_result_list_resp = user_dataset_review_ns.model("12. review_result_list_resp", { + 'review_result_list': fields.List(fields.Nested(review_result), description='The review notes of batch datasets'), + 'message': fields.String(description='Success or fail'), + 'notification': fields.String(description='Customized notification') + }) + + # Single license info + dataset_license = user_dataset_review_ns.model("13. dataset_license", { + 'full_name': fields.String(description='License', required=True), + 'identifier': fields.String(description='License identifier', required=True), + 'fsf_free_libre': fields.String(description='fsf_free/libre', required=False), + 'osi_approved': fields.String(description='osi approved', required=False) + }) + + # Batch licenses info + dataset_license_list_req = user_dataset_review_ns.model("14. dataset_review_list_req", { + 'user_id': fields.Integer(description='The id of AIBOM author', required=True), + 'dataset_license_list': fields.List(fields.Nested(dataset_license), description='Batch upload info', required=True) + }) + + # The result of Batch licenses info + dataset_license_list_resp = user_dataset_review_ns.model("15. dataset_license_list_resp", { + 'license_success_list': fields.List(fields.Nested(dataset_license), description='Uploaded license info'), + 'license_fail_list': fields.List(fields.Nested(dataset_license), description='Failed license info'), + 'message': fields.String(description='Success or fail'), + 'notification': fields.String(description='Customized notification') + }) + + # The result of Batch licenses info + license_list_resp = user_dataset_review_ns.model("16. license_list_resp", { + 'spdx_license_list': fields.List(fields.Nested(dataset_license), description='License list'), + 'message': fields.String(description='Success or fail'), + 'notification': fields.String(description='Customized notification') + }) + + string_req = user_dataset_review_ns.model("17. String Req", { + 'text': fields.String(description='text'), + }) diff --git a/sigs/datacompliance/dataset-reviewer/main/data_transform_object/license.py b/sigs/datacompliance/dataset-reviewer/main/data_transform_object/license.py new file mode 100644 index 0000000000000000000000000000000000000000..0b15bd1c161edd5d987ad6398228d9f4f9d6e7da --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/main/data_transform_object/license.py @@ -0,0 +1,9 @@ +from flask_restplus import fields + +from main.util.namespace import user_dataset_review_ns + + +class LicenseObject: + AIBOM_user = user_dataset_review_ns.model("AIBOM_user", { + 'user_id': fields.Integer(description='user id', required=True), + }) diff --git a/sigs/datacompliance/dataset-reviewer/main/data_transform_object/user.py b/sigs/datacompliance/dataset-reviewer/main/data_transform_object/user.py new file mode 100644 index 0000000000000000000000000000000000000000..17628e8edc4c089cdd365830797c3ab295b3bae7 --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/main/data_transform_object/user.py @@ -0,0 +1,9 @@ +from flask_restplus import fields + +from main.util.namespace import user_dataset_review_ns + + +class UserObject: + AIBOM_user = user_dataset_review_ns.model("AIBOM_user", { + 'user_id': fields.Integer(description='user id', required=True), + }) diff --git a/sigs/datacompliance/dataset-reviewer/main/model/__init__.py b/sigs/datacompliance/dataset-reviewer/main/model/__init__.py new file mode 100644 index 0000000000000000000000000000000000000000..e69de29bb2d1d6434b8b29ae775ad8c2e48c5391 diff --git a/sigs/datacompliance/dataset-reviewer/main/model/db_models.py b/sigs/datacompliance/dataset-reviewer/main/model/db_models.py new file mode 100644 index 0000000000000000000000000000000000000000..1095e357efca1343165a9b68863606392c25821f --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/main/model/db_models.py @@ -0,0 +1,156 @@ +from main import db + + +class Pending_aibom(db.Model): + _tablename_ = 'pending_aibom' + + id = db.Column(db.Integer, unique=True, + primary_key=True, autoincrement=True) + # Dataset AIBOM attributes + name = db.Column(db.String(255)) # dataset name + location = db.Column(db.String(255)) # dataset official website + originator = db.Column(db.String(255)) # contributors + license_location = db.Column(db.String(255)) # license location + concluded_license = db.Column(db.String(255)) # SPDX License List + declared_license = db.Column(db.String(255)) # customized license + type = db.Column(db.String(255)) # types of this dataset + size = db.Column(db.String(255)) # total size of this dataset + # The purpose why this dataset made + intended_use = db.Column(db.String(255)) + checksum = db.Column(db.String(255)) # checksum + data_collection_process = db.Column( + db.String(255)) # The collection process of data + known_biases = db.Column(db.Boolean) + sensitive_personal_information = db.Column(db.Boolean) + offensive_content = db.Column(db.Boolean) + # attach the user info + # the user who should finish the AIBOM of this dataset + user_id = db.Column(db.Integer) + # notes + # notes when rejected in review + rejection_notes = db.Column(db.String(255)) + + +class Pending_review(db.Model): + _tablename_ = 'pending_review' + + id = db.Column(db.Integer, unique=True, + primary_key=True, autoincrement=True) + # Dataset AIBOM attributes + name = db.Column(db.String(255)) # dataset name + location = db.Column(db.String(255)) # dataset official website + originator = db.Column(db.String(255)) # contributors + license_location = db.Column(db.String(255)) # license location + concluded_license = db.Column(db.String(255)) # SPDX License List + declared_license = db.Column(db.String(255)) # customized license + type = db.Column(db.String(255)) # types of this dataset + size = db.Column(db.String(255)) # total size of this dataset + # The purpose why this dataset made + intended_use = db.Column(db.String(255)) + checksum = db.Column(db.String(255)) # checksum + data_collection_process = db.Column( + db.String(255)) # The collection process of data + known_biases = db.Column(db.Boolean) + sensitive_personal_information = db.Column(db.Boolean) + offensive_content = db.Column(db.Boolean) + # attach the user info + # the user who should finish the AIBOM of this dataset + user_id = db.Column(db.Integer) + # initial review suggestion + review_result_initial = db.Column(db.String(255)) # initial review result + # is this dataset allowed to be used commercially + is_dataset_commercially_used_initial = db.Column(db.Boolean) + # is this dataset allowed to be distributed commercially + is_dataset_commercially_distributed_initial = db.Column(db.Boolean) + # is this dataset allowed to be published commercially + is_product_commercially_published_initial = db.Column(db.Boolean) + right_initial = db.Column(db.String(255)) # rights for this dataset + # obligation for this dataset + obligation_initial = db.Column(db.String(255)) + # limitation for this dataset + limitation_initial = db.Column(db.String(255)) + notes_initial = db.Column(db.String(255)) # notes for the initial review + + +class Review_result(db.Model): + _tablename_ = 'dataset_review' + + id = db.Column(db.Integer, unique=True, + primary_key=True, autoincrement=True) + # Dataset AIBOM attributes + name = db.Column(db.String(255)) # dataset name + location = db.Column(db.String(255)) # dataset official website + originator = db.Column(db.String(255)) # contributors + license_location = db.Column(db.String(255)) # license location + concluded_license = db.Column(db.String(255)) # SPDX License List + declared_license = db.Column(db.String(255)) # customized license + type = db.Column(db.String(255)) # types of this dataset + size = db.Column(db.String(255)) # total size of this dataset + # The purpose why this dataset made + intended_use = db.Column(db.String(255)) + checksum = db.Column(db.String(255)) # checksum + data_collection_process = db.Column( + db.String(255)) # The collection process of data + known_biases = db.Column(db.Boolean) + sensitive_personal_information = db.Column(db.Boolean) + offensive_content = db.Column(db.Boolean) + # attach the user info + # the user who should finish the AIBOM of this dataset + user_id = db.Column(db.Integer) + # initial review suggestion + review_result_initial = db.Column(db.String(255)) # initial review result + # is this dataset allowed to be used commercially + is_dataset_commercially_used_initial = db.Column(db.Boolean) + # is this dataset allowed to be distributed commercially + is_dataset_commercially_distributed_initial = db.Column(db.Boolean) + # is this dataset allowed to be published commercially + is_product_commercially_published_initial = db.Column(db.Boolean) + right_initial = db.Column(db.String(255)) # rights for this dataset + # obligation for this dataset + obligation_initial = db.Column(db.String(255)) + # limitation for this dataset + limitation_initial = db.Column(db.String(255)) + notes_initial = db.Column(db.String(255)) # notes for the initial review + # final review result + review_result_final = db.Column(db.String(255)) # final review result + # is this dataset allowed to be used commercially + is_dataset_commercially_used_final = db.Column(db.Boolean) + # is this dataset allowed to be distributed commercially + is_dataset_commercially_distributed_final = db.Column(db.Boolean) + # is this dataset allowed to be published commercially + is_product_commercially_published_final = db.Column(db.Boolean) + right_final = db.Column(db.String(255)) # rights for this dataset + obligation_final = db.Column(db.String(255)) # obligation for this dataset + limitation_final = db.Column(db.String(255)) # limitation for this dataset + notes_final = db.Column(db.String(255)) # notes for the final review + + +class Spdx_license_list(db.Model): + _tablename_ = 'spdx_license_list' + + id = db.Column(db.Integer, unique=True, + primary_key=True, autoincrement=True) + full_name = db.Column(db.String(255)) + identifier = db.Column(db.String(255)) + fsf_free_libre = db.Column(db.String(255)) + osi_approved = db.Column(db.String(255)) + user_id = db.Column(db.Integer) + + +class Users(db.Model): + _tablename_ = 'users' + + id = db.Column(db.Integer, unique=True, + primary_key=True, autoincrement=True) + account = db.Column(db.String(255)) + password = db.Column(db.String(255)) + verification = db.Column(db.String(255)) + + +class Admin(db.Model): + _tablename_ = 'admin' + + id = db.Column(db.Integer, unique=True, + primary_key=True, autoincrement=True) + account = db.Column(db.String(255)) + uid = db.Column(db.Integer) diff --git a/sigs/datacompliance/dataset-reviewer/main/service/dataset_review.py b/sigs/datacompliance/dataset-reviewer/main/service/dataset_review.py new file mode 100644 index 0000000000000000000000000000000000000000..f71d151b89d296b4ad198702f9ebf74800c534bf --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/main/service/dataset_review.py @@ -0,0 +1,906 @@ +import traceback + +from main.model.db_models import Pending_aibom, Pending_review, Review_result, Admin, Spdx_license_list +from main import db # db is not required for queries, but is required for writes + +import os +import time +import random +import csv +import xlrd +import codecs +import logging + + +def review_upload(user_id, dataset_review_list): + """ + @param: user_id: the user who upload datasets to obtain the review result + @param: dataset_review_list: list of dataset identifiers + """ + datasets_review_result = [] + datasets_pending_aibom = [] + + for dataset_review in dataset_review_list: + # get the identifiers of each dataset + name = dataset_review.get("name", "") + location = dataset_review.get("location", "") + originator = dataset_review.get("originator", []) + # split via comma and convert to hashset + originator = set([contributor.strip() + for contributor in originator.split(",")]) + + # Get the potential corresponding audited dataset from the table review_result + try: + review_result = Review_result.query.filter_by( + name=name, location=location).all() + except Exception as e: + ret = dict() + ret['message'] = 'fail' + ret['notification'] = e + return ret + + is_reviewed = False # Whether the dataset has been audited + + if name != "" and location != "" and len(originator) != 0: + for review in review_result: + # Gets the originator of the potential corresponding reviewed dataset + review_originator = set( + [originator.strip() for originator in review.originator.split(",")]) + # Calculate the number of originator intersections between user-uploaded datasets and potentially reviewed datasets + intersection = len(originator & review_originator) + # If the overlap number is greater than or equal to 2, or more than half of Originators provided by users overlap, the dataset uploaded by users is considered to have been reviewed + if intersection >= 2 or intersection / len(originator) >= 0.5: + datasets_review_result.append(review) + is_reviewed = True + break + + if not is_reviewed: + dataset_pending_aibom = pending_aibom_transfer( + dataset_review, user_id) + try: + db.session.add(dataset_pending_aibom) + db.session.commit() + datasets_pending_aibom.append(dataset_pending_aibom) + except Exception as e: + print(e) + db.session.rollback() + + ret = dict() + ret['review_result_list'] = datasets_review_result + ret['pending_aibom_list'] = datasets_pending_aibom + ret['message'] = 'success' + ret['notification'] = '' + + return ret + + +def get_pending_aibom_by_user(user_id): + ret = dict() + try: + pending_aibom = Pending_aibom.query.filter_by(user_id=user_id).all() + ret['pending_aibom_list'] = pending_aibom + ret['message'] = 'success' + ret['notification'] = '' + except Exception as e: + ret['message'] = 'fail' + ret['notification'] = e + return ret + + +def save_pending_aibom_list(pending_aibom_list): + ret = dict() + if len(pending_aibom_list) == 0: + ret['message'] = 'fail' + ret['notification'] = 'nothing to save' + return ret + + for new_pending_aibom in pending_aibom_list: + try: + ori_pending_aibom = Pending_aibom.query.filter_by(id=new_pending_aibom.get('id', ''), + user_id=new_pending_aibom.get('user_id', '')).first() + except Exception as e: + ret['message'] = 'fail' + ret['notification'] = e + return ret + + if ori_pending_aibom is not None: + ori_pending_aibom = pending_aibom_transfer(new_pending_aibom, new_pending_aibom.get('user_id', ''), + ori_pending_aibom) + try: + db.session.add(ori_pending_aibom) + db.session.commit() + except Exception as e: + db.session.rollback() + ret['message'] = 'fail' + ret['notification'] = e + return ret + + ret['message'] = 'success' + ret['notification'] = '' + + return ret + + +def submit_pending_aibom_list(pending_aibom_list): + ret = dict() + if len(pending_aibom_list) == 0: + ret['message'] = 'fail' + ret['notification'] = 'nothing to submit' + return ret + + error_pending_aibom_format = [] + + for pending_aibom in pending_aibom_list: + is_pass = format_check_aibom(pending_aibom) + + if is_pass: + pending_review = convert_aibom_to_review(pending_aibom) + to_delete = Pending_aibom.query.filter_by(id=pending_aibom.get('id', ''), + user_id=pending_aibom.get('user_id', '')).first() + if to_delete is None: + ret['message'] = 'fail' + ret['notification'] = 'Cannot submit due to no record in pending aibom' + return ret + + to_delete = Pending_aibom.__table__.delete().where( + Pending_aibom.user_id == pending_aibom.get('user_id', '')).where( + Pending_aibom.id == pending_aibom.get('id', '')) + + try: + db.session.execute(to_delete) + db.session.add(pending_review) + db.session.commit() + except Exception as e: + db.session.rollback() + ret['message'] = 'fail' + ret['notification'] = e + return ret + else: + error_pending_aibom_format.append(pending_aibom) + + if len(error_pending_aibom_format) != 0: + ret['pending_aibom_list'] = error_pending_aibom_format + ret['message'] = "fail" + ret['notification'] = "AIBOM info has been submitted, the format of AIBOM is incorrect for {} dataset, please submit after modify".format( + len(error_pending_aibom_format)) + else: + ret['message'] = "success" + ret['notification'] = "" + + return ret + + +def remove_pending_aibom_list(user_id, pending_aibom_ids): + to_delete = Pending_aibom.__table__.delete().where(Pending_aibom.user_id == user_id).where( + Pending_aibom.id.in_(pending_aibom_ids)) + + ret = dict() + + try: + # Execute this sql to change the database via session + db.session.execute(to_delete) + db.session.commit() # Transaction commit. + + ret['message'] = 'success' + ret['notification'] = '' + + except Exception as e: + db.session.rollback() + + ret['message'] = 'fail' + ret['notification'] = e + + return ret + + +def is_admin(user_id, account): + ret = dict() + try: + user_id = int(user_id) + account = str(account) + admin = Admin.query.filter_by(uid=user_id, account=account).first() + + if admin is None: + ret['message'] = 'fail' + ret['notification'] = 'not admin!' + return ret + except Exception as e: + ret['message'] = 'fail' + ret['notification'] = e + return ret + + ret['message'] = 'success' + ret['notification'] = '' + return ret + + +def get_pending_review_list(user_id): + ret = dict() + try: + if user_id == -1: + pending_review = Pending_review.query.all() + else: + pending_review = Pending_review.query.filter_by( + user_id=user_id).all() + except Exception as e: + ret['message'] = 'fail' + ret['notification'] = e + return ret + + ret['pending_review_list'] = pending_review + ret['message'] = 'success' + ret['notification'] = '' + return ret + + +def save_pending_review_list(pending_review_list): + ret = dict() + for new_pending_review in pending_review_list: + ori_pending_review = Pending_review.query.filter_by( + id=new_pending_review.get('id', '')).first() + if ori_pending_review is not None: + ori_pending_review = pending_review_transfer( + ori_pending_review, new_pending_review) + try: + db.session.add(ori_pending_review) + db.session.commit() + except Exception as e: + db.session.rollback() + ret['message'] = 'fail' + ret['notification'] = e + return ret + + ret['message'] = 'success' + ret['notification'] = '' + return ret + + +def reject_review(user_id, pending_review_ids, rejection_notes): + ret = dict() + pending_aibom_list = [] + + for index, pending_review_id in enumerate(pending_review_ids): + pending_review = Pending_review.query.filter_by( + id=pending_review_id, user_id=user_id).first() + if pending_review is None: + continue + + to_delete = Pending_review.__table__.delete().where( + Pending_review.id == pending_review_id).where(Pending_review.user_id == user_id) + + pending_aibom = convert_review_to_aibom(pending_review) + pending_aibom.rejection_notes = "" if index == len( + rejection_notes) else rejection_notes[index] + try: + db.session.add(pending_aibom) + db.session.execute(to_delete) + db.session.commit() + pending_aibom_list.append(pending_aibom) + except Exception as e: + db.session.rollback() + ret['message'] = 'fail' + ret['notification'] = e + return ret + + ret['pending_aibom_list'] = pending_aibom_list + ret['message'] = 'success' + ret['notification'] = '' + return ret + + +def submit_pending_review_list(pending_review_list): + ret = dict() + if len(pending_review_list) == 0: + ret['message'] = 'fail' + ret['notification'] = 'nothing to submit' + return ret + + error_pending_review_format = [] + + for pending_review in pending_review_list: + is_pass = format_check_aibom( + pending_review) and format_check_review(pending_review) # 格式检查 + + if is_pass: + review_result = convert_review_to_result(pending_review) + to_delete = Pending_review.query.filter_by(id=pending_review.get('id', ''), + user_id=pending_review.get('user_id', '')).first() + if to_delete is None: + continue + + to_delete = Pending_review.__table__.delete().where( + Pending_review.user_id == pending_review.get('user_id', '')).where( + Pending_review.id == pending_review.get('id', '')) + + try: + db.session.execute(to_delete) + db.session.add(review_result) + db.session.commit() + except Exception as e: + db.session.rollback() + ret['message'] = 'fail' + ret['notification'] = e + return ret + else: + error_pending_review_format.append(pending_review) + + if len(error_pending_review_format) != 0: + ret['pending_review_list'] = error_pending_review_format + ret['message'] = "fail" + ret['notification'] = "review info has been submitted, the format of review is incorrect for {} dataset, please submit after modify".format( + len(error_pending_review_format)) + else: + ret['message'] = "success" + ret['notification'] = "" + + return ret + + +def get_review_result_list_for_dataset_name(dataset_name): + ret = dict() + review_result_dict = {} + match_dataset_review_result_list = [] + try: + if dataset_name is not None \ + and len(dataset_name) != 0: + match_dataset_review_result_list = list(Review_result.query.filter( + Review_result.name.like('%' + dataset_name + '%')).all()) + # review_result_list = Review_result.query.all() + # for review_result in review_result_list: + # review_result_dict[review_result.name] = review_result + # + # for dataset_name in dataset_name_list: + # match_dataset_review_result = review_result_dict.get(dataset_name) + # if match_dataset_review_result is None: + # continue + + # match_dataset_review_result_list.append(match_dataset_review_result) + + except Exception as e: + ret['message'] = 'fail' + ret['notification'] = e + return ret + + ret['review_result_list'] = match_dataset_review_result_list + ret['message'] = 'success' + ret['notification'] = '' + return ret + + +def get_review_result_list_for_dataset_name_list(dataset_name_list): + ret = dict() + review_result_dict = {} + match_dataset_review_result_list = [] + try: + if dataset_name_list is not None \ + and len(dataset_name_list) != 0: + review_result_list = Review_result.query.all() + for review_result in review_result_list: + review_result_dict[review_result.name] = review_result + + for dataset_name in dataset_name_list: + match_dataset_review_result = review_result_dict.get(dataset_name) + if match_dataset_review_result is None: + continue + match_dataset_review_result_list.append(match_dataset_review_result) + + except Exception as e: + ret['message'] = 'fail' + ret['notification'] = e + return ret + + ret['review_result_list'] = match_dataset_review_result_list + ret['message'] = 'success' + ret['notification'] = '' + return ret + + +def get_review_result_list(user_id): + ret = dict() + try: + if user_id == -1: + review_result = Review_result.query.all() + else: + review_result = Review_result.query.filter_by( + user_id=user_id).all() + except Exception as e: + ret['message'] = 'fail' + ret['notification'] = e + return ret + + ret['review_result_list'] = review_result + ret['message'] = 'success' + ret['notification'] = '' + return ret + + +def license_upload(user_id, dataset_license_list): + license_success_list = [] + license_fail_list = [] + + for dataset_license in dataset_license_list: + # get the identifiers of each dataset + full_name = dataset_license.get("full_name", "") + identifier = dataset_license.get("identifier", "") + + # Get the potential corresponding audited dataset from the table review_result + try: + spdx_license_list = Spdx_license_list.query.filter_by( + full_name=full_name, identifier=identifier).all() + except Exception as e: + ret = dict() + ret['message'] = 'fail' + ret['notification'] = e + return ret + + if spdx_license_list is None or len(spdx_license_list) == 0: + cur_license = license_transfer(dataset_license, user_id) + try: + db.session.add(cur_license) + db.session.commit() + license_success_list.append(dataset_license) + except Exception as e: + print(e) + db.session.rollback() + else: + license_fail_list.append(dataset_license) + + ret = dict() + if len(license_fail_list) != 0: + ret['license_success_list'] = license_success_list + ret['license_fail_list'] = license_fail_list + ret['message'] = 'fail' + ret['notification'] = '' + else: + ret['message'] = 'success' + ret['notification'] = '' + + return ret + + +def get_dataset_license_list(text): + ret = dict() + try: + if text == "": + spdx_license_list = Spdx_license_list.query.all() + else: + spdx_license_list_1 = set(Spdx_license_list.query.filter( + Spdx_license_list.full_name.like('%' + text + '%')).all()) + spdx_license_list_2 = set(Spdx_license_list.query.filter( + Spdx_license_list.identifier.like('%' + text + '%')).all()) + spdx_license_list = spdx_license_list_1 | spdx_license_list_2 + + except Exception as e: + ret['message'] = 'fail' + ret['notification'] = e + return ret + + ret['spdx_license_list'] = spdx_license_list + ret['message'] = 'success' + ret['notification'] = '' + return ret + + +def pending_aibom_transfer(new_aibom_info, user_id, ori_aibom_info=None): + if ori_aibom_info is None: + dataset_pending_aibom = Pending_aibom( + name=new_aibom_info.get("name", ""), + location=new_aibom_info.get("location", ""), + originator=new_aibom_info.get("originator", ""), + license_location=new_aibom_info.get("license_location", ""), + # concluded_license=new_aibom_info.get("concluded_license", None), + # declared_license=new_aibom_info.get("declared_license", None), + type=new_aibom_info.get("type", ""), + size=new_aibom_info.get("size", ""), + intended_use=new_aibom_info.get("intended_use", ""), + # checksum=new_aibom_info.get("checksum", None), + # data_collection_process=new_aibom_info.get("data_collection_process", None), + # known_biases=new_aibom_info.get("known_biases", 0), + # sensitive_personal_information=new_aibom_info.get("sensitive_personal_information", 0), + # offensive_content=new_aibom_info.get("offensive_content", 0), + user_id=user_id + ) + return dataset_pending_aibom + else: + if "name" in new_aibom_info.keys(): + ori_aibom_info.name = new_aibom_info.get("name", "") + if "location" in new_aibom_info.keys(): + ori_aibom_info.location = new_aibom_info.get("location", "") + if "originator" in new_aibom_info.keys(): + ori_aibom_info.originator = new_aibom_info.get("originator", "") + if "license_location" in new_aibom_info.keys(): + ori_aibom_info.license_location = new_aibom_info.get( + "license_location", "") + if "concluded_license" in new_aibom_info.keys(): + ori_aibom_info.concluded_license = new_aibom_info.get( + "concluded_license", None) + if "declared_license" in new_aibom_info.keys(): + ori_aibom_info.declared_license = new_aibom_info.get( + "declared_license", None) + if "type" in new_aibom_info.keys(): + ori_aibom_info.type = new_aibom_info.get("type", "") + if "size" in new_aibom_info.keys(): + ori_aibom_info.size = new_aibom_info.get("size", "") + if "intended_use" in new_aibom_info.keys(): + ori_aibom_info.intended_use = new_aibom_info.get( + "intended_use", "") + if "checksum" in new_aibom_info.keys(): + ori_aibom_info.checksum = new_aibom_info.get("checksum", None) + if "data_collection_process" in new_aibom_info.keys(): + ori_aibom_info.data_collection_process = new_aibom_info.get( + "data_collection_process", None) + if "known_biases" in new_aibom_info.keys() and new_aibom_info.get("known_biases") is not None: + ori_aibom_info.known_biases = new_aibom_info.get("known_biases", 0) + if "sensitive_personal_information" in new_aibom_info.keys() and new_aibom_info.get( + "sensitive_personal_information") is not None: + ori_aibom_info.sensitive_personal_information = new_aibom_info.get( + "sensitive_personal_information", 0) + if "offensive_content" in new_aibom_info.keys() and new_aibom_info.get("offensive_content") is not None: + ori_aibom_info.offensive_content = new_aibom_info.get( + "offensive_content", 0) + return ori_aibom_info + + +def pending_review_transfer(ori_pending_review, new_pending_review): + ori_pending_review.name = new_pending_review.get("name", "") + ori_pending_review.location = new_pending_review.get("location", "") + ori_pending_review.originator = new_pending_review.get("originator", "") + ori_pending_review.license_location = new_pending_review.get( + "license_location", "") + ori_pending_review.concluded_license = new_pending_review.get( + "concluded_license", None) + ori_pending_review.declared_license = new_pending_review.get( + "declared_license", None) + ori_pending_review.type = new_pending_review.get("type", "") + ori_pending_review.size = new_pending_review.get("size", "") + ori_pending_review.intended_use = new_pending_review.get( + "intended_use", "") + ori_pending_review.checksum = new_pending_review.get("checksum", None) + ori_pending_review.data_collection_process = new_pending_review.get( + "data_collection_process", None) + ori_pending_review.known_biases = new_pending_review.get( + "known_biases", "") + ori_pending_review.sensitive_personal_information = new_pending_review.get( + "sensitive_personal_information", None) + ori_pending_review.offensive_content = new_pending_review.get( + "offensive_content", None) + + # ori_pending_review.user_id = new_pending_review.get("user_id", "") + + ori_pending_review.review_result_initial = new_pending_review.get( + "review_result_initial", "") + ori_pending_review.is_dataset_commercially_used_initial = new_pending_review.get( + "is_dataset_commercially_used_initial", 0) + ori_pending_review.is_dataset_commercially_distributed_initial = new_pending_review.get( + "is_dataset_commercially_distributed_initial", 0) + ori_pending_review.is_product_commercially_published_initial = new_pending_review.get( + "is_product_commercially_published_initial", 0) + ori_pending_review.right_initial = new_pending_review.get( + "right_initial", None) + ori_pending_review.obligation_initial = new_pending_review.get( + "obligation_initial", None) + ori_pending_review.limitation_initial = new_pending_review.get( + "limitation_initial", None) + ori_pending_review.notes_initial = new_pending_review.get( + "notes_initial", None) + + return ori_pending_review + + +def license_transfer(dataset_license, user_id): + cur_license = Spdx_license_list( + full_name=dataset_license.get("full_name", ""), + identifier=dataset_license.get("identifier", ""), + user_id=user_id + ) + return cur_license + + +def convert_aibom_to_review(pending_aibom): + pending_review = Pending_review( + name=pending_aibom.get("name", ""), + location=pending_aibom.get("location", ""), + originator=pending_aibom.get("originator", ""), + license_location=pending_aibom.get("license_location", ""), + concluded_license=pending_aibom.get("concluded_license", None), + declared_license=pending_aibom.get("declared_license", None), + type=pending_aibom.get("type", ""), + size=pending_aibom.get("size", ""), + intended_use=pending_aibom.get("intended_use", None), + checksum=pending_aibom.get("checksum", ""), + data_collection_process=pending_aibom.get( + "data_collection_process", None), + known_biases=pending_aibom.get("known_biases", 0), + sensitive_personal_information=pending_aibom.get( + "sensitive_personal_information", 0), + offensive_content=pending_aibom.get("offensive_content", 0), + user_id=pending_aibom.get('user_id', ""), + review_result_initial="", + is_dataset_commercially_used_initial=0, + is_dataset_commercially_distributed_initial=0, + is_product_commercially_published_initial=0 + ) + + return pending_review + + +def convert_review_to_aibom(pending_review): + pending_aibom = Pending_aibom( + name=pending_review.name, + location=pending_review.location, + originator=pending_review.originator, + license_location=pending_review.license_location, + concluded_license=pending_review.concluded_license, + declared_license=pending_review.declared_license, + type=pending_review.type, + size=pending_review.size, + intended_use=pending_review.intended_use, + checksum=pending_review.checksum, + data_collection_process=pending_review.data_collection_process, + known_biases=pending_review.known_biases, + sensitive_personal_information=pending_review.sensitive_personal_information, + offensive_content=pending_review.offensive_content, + + user_id=pending_review.user_id, + ) + + return pending_aibom + + +def convert_review_to_result(pending_review): + review_result = Review_result( + name=pending_review.get("name", ""), + location=pending_review.get("location", ""), + originator=pending_review.get("originator", ""), + license_location=pending_review.get("license_location", ""), + concluded_license=pending_review.get("concluded_license", None), + declared_license=pending_review.get("declared_license", None), + type=pending_review.get("type", ""), + size=pending_review.get("size", ""), + intended_use=pending_review.get("intended_use", ""), + checksum=pending_review.get("checksum", None), + data_collection_process=pending_review.get( + "data_collection_process", None), + known_biases=pending_review.get("known_biases", None), + sensitive_personal_information=pending_review.get( + "sensitive_personal_information", None), + offensive_content=pending_review.get("offensive_content", None), + + user_id=pending_review.get("user_id", ""), + + review_result_initial=pending_review.get("review_result_initial", ""), + is_dataset_commercially_used_initial=pending_review.get( + "is_dataset_commercially_used_initial", 0), + is_dataset_commercially_distributed_initial=pending_review.get( + "is_dataset_commercially_distributed_initial", 0), + is_product_commercially_published_initial=pending_review.get( + "is_product_commercially_published_initial", 0), + right_initial=pending_review.get("right_initial", None), + obligation_initial=pending_review.get("obligation_initial", None), + limitation_initial=pending_review.get("limitation_initial", None), + notes_initial=pending_review.get("notes_initial", None), + + review_result_final="", + is_dataset_commercially_used_final=0, + is_dataset_commercially_distributed_final=0, + is_product_commercially_published_final=0, + right_final="", + obligation_final="", + limitation_final="", + notes_final="", + ) + + return review_result + + +def format_check_aibom(pending_aibom): + keys = {"name", "location", "originator", "license_location", + "type", "size", "intended_use", "user_id"} + for key in keys: + if key not in pending_aibom.keys() or len(str(pending_aibom[key])) == 0: + return False + if "concluded_license" not in pending_aibom.keys() and "declared_license" not in pending_aibom.keys(): + return False + if pending_aibom['concluded_license'] is None and pending_aibom['declared_license'] is None: + return False + if pending_aibom['concluded_license'] is not None and len(pending_aibom['concluded_license']) != 0: + return True + if pending_aibom['declared_license'] is not None and len(pending_aibom['declared_license']) != 0: + return True + + return True + + +def format_check_review(pending_review): + keys = {"review_result_initial", "is_dataset_commercially_used_initial", + "is_dataset_commercially_distributed_initial", "is_product_commercially_published_initial"} + for key in keys: + if key not in pending_review.keys() or len(str(pending_review[key])) == 0: + return False + return True + + +def file_suffix_check(cur_file): + if "." in cur_file.filename and ( + cur_file.filename.rsplit('.', 1)[1] == "csv" or cur_file.filename.rsplit('.', 1)[1] == "xlsx"): + return True + return False + + +def file_save(user_id, cur_file, path): + try: + file_name = str(user_id) + "_" + str(int(time.time())) + \ + "_" + str(random.randint(0, 2147483647)) + ".csv" + + # The absolute address of the target to save + root_path = os.getcwd() # The absolute path of the current project + rel_path = "/static/" + path + "/" # Relative path to the folder + abs_path = root_path + rel_path # The absolute path to the img + + if not os.path.exists(abs_path): + os.makedirs(abs_path) + + if cur_file.filename.rsplit('.', 1)[1] == "csv": + cur_file.save(abs_path + file_name) + else: + xlsx_to_csv(cur_file, abs_path + file_name) + return True, abs_path + file_name + except Exception as e: + return False, e + + +def xlsx_to_csv(cur_file, file_path): + xlsx_path = file_path.rsplit(".")[0] + ".xlsx" + cur_file.save(xlsx_path) + workbook = xlrd.open_workbook(xlsx_path) + table = workbook.sheet_by_index(0) + with codecs.open(file_path, 'w', encoding='utf-8') as f: + write = csv.writer(f) + for row_num in range(table.nrows): + row_value = table.row_values(row_num) + for i in range(len(row_value)): + if isinstance(row_value[i], float) and abs(int(row_value[i]) - row_value[i]) < 0.00001: + row_value[i] = int(row_value[i]) + write.writerow(row_value) + + +def file_convert_dataset(user_id, cur_file): + ret = dict() + if cur_file is None: + ret['message'] = 'fail' + ret['notification'] = 'File upload fail!' + return ret + + if not file_suffix_check(cur_file): + ret['message'] = 'fail' + ret['notification'] = 'Please upload the file in csv or xlsx!' + return ret + + is_success, msg = file_save(user_id, cur_file, 'upload_by_user') + if not is_success: + ret['message'] = 'fail' + ret['notification'] = msg + return ret + + dataset_review_list = [] + cur_file = csv.reader(open(msg)) + cnt = 0 + for line in cur_file: + if cnt == 0: + cnt += 1 + continue + dataset = dict() + dataset['name'] = str(line[0]) + dataset['location'] = str(line[1]) + dataset['originator'] = str(line[2]) + dataset_review_list.append(dataset) + + ret['message'] = 'success' + ret['notification'] = dataset_review_list + return ret + + +def file_convert_license(user_id, cur_file): + ret = dict() + if cur_file is None: + ret['message'] = 'fail' + ret['notification'] = 'File upload fail!' + return ret + + if not file_suffix_check(cur_file): + ret['message'] = 'fail' + ret['notification'] = 'Please upload the file in csv or xlsx!' + return ret + + is_success, msg = file_save(user_id, cur_file, 'license_upload_by_user') + if not is_success: + ret['message'] = 'fail' + ret['notification'] = msg + return ret + + dataset_license_list = [] + cur_file = csv.reader(open(msg)) + cnt = 0 + + try: + for line in cur_file: + if cnt == 0: + cnt += 1 + continue + dataset = dict() + dataset['full_name'] = str(line[0]) + dataset['identifier'] = str(line[1]) + dataset['user_id'] = int(line[2]) + dataset_license_list.append(dataset) + except Exception as e: + ret['message'] = 'fail' + ret['notification'] = e + return ret + + ret['message'] = 'success' + ret['notification'] = dataset_license_list + return ret + + +def review_result_download(user_id, review_result_list): + ret = dict() + + file_name = str(user_id) + "_" + str(int(time.time())) + \ + "_" + str(random.randint(0, 2147483647)) + ".csv" + # The absolute address of the target to save + root_path = os.getcwd() # The absolute path of the current project + rel_path = "/static" + "/download_by_user/" # Relative path to the folder + abs_path = root_path + rel_path # The absolute path to the img + + try: + if not os.path.exists(abs_path): + os.makedirs(abs_path) + + with open("." + rel_path + file_name, "w", newline='', encoding='utf-8') as csvfile: + writer = csv.writer(csvfile) + writer.writerow( + ["name", "location", "originator", "license_location", "concluded_license", "declared_license", + "type", "size", "intended_use", "checksum", "data_collection_process", "known_biases", + "sensitive_personal_information", "offensive_content", "review_result_initial", + "is_dataset_commercially_used_initial", "is_dataset_commercially_distributed_initial", + "is_product_commercially_published_initial", "right_initial", + "obligation_initial", "limitation_initial", "notes_initial"]) + for review_result in review_result_list: + writer.writerow([review_result.name, review_result.location, review_result.originator, + review_result.license_location, + review_result.concluded_license, review_result.declared_license, review_result.type, + review_result.size, + review_result.intended_use, review_result.checksum, + review_result.data_collection_process, + review_result.known_biases, review_result.sensitive_personal_information, + review_result.offensive_content, review_result.review_result_initial, + review_result.is_dataset_commercially_used_initial, + review_result.is_dataset_commercially_distributed_initial, + review_result.is_product_commercially_published_initial, review_result.right_initial, + review_result.obligation_initial, review_result.limitation_initial, + review_result.notes_initial]) + except Exception as e: + logging.error("review_result_download_异常了!!", e) + ret['message'] = 'fail' + ret['notification'] = e + return ret + + ret['message'] = 'success' + ret['download_path'] = abs_path + ret['file_name'] = file_name + return ret + + +def get_review_result_by_id(result_id): + ret = dict() + try: + review_result = Review_result.query.filter_by(id=result_id).all() + except Exception as e: + ret['message'] = 'fail' + ret['notification'] = e + return ret + + ret['review_result_list'] = review_result + ret['message'] = 'success' + ret['notification'] = '' + return ret diff --git a/sigs/datacompliance/dataset-reviewer/main/util/__init__.py b/sigs/datacompliance/dataset-reviewer/main/util/__init__.py new file mode 100644 index 0000000000000000000000000000000000000000..e69de29bb2d1d6434b8b29ae775ad8c2e48c5391 diff --git a/sigs/datacompliance/dataset-reviewer/main/util/namespace.py b/sigs/datacompliance/dataset-reviewer/main/util/namespace.py new file mode 100644 index 0000000000000000000000000000000000000000..74615508cd807c0f50958816ee37b038bc8e313e --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/main/util/namespace.py @@ -0,0 +1,7 @@ +from flask_restplus import Namespace + +user_dataset_review_ns = Namespace("User End - Dataset Review API", + description="All functions for dataset review.") + +auth_dataset_review_ns = Namespace("Review End - Dataset Review API", + description="All functions for dataset review.") diff --git a/sigs/datacompliance/dataset-reviewer/readme_src/API-Document.png b/sigs/datacompliance/dataset-reviewer/readme_src/API-Document.png new file mode 100644 index 0000000000000000000000000000000000000000..4d183a0a3d57ef7b071a492e934a274b71193a62 Binary files /dev/null and b/sigs/datacompliance/dataset-reviewer/readme_src/API-Document.png differ diff --git a/sigs/datacompliance/dataset-reviewer/readme_src/Database.png b/sigs/datacompliance/dataset-reviewer/readme_src/Database.png new file mode 100644 index 0000000000000000000000000000000000000000..e2cc627b89099be64f6e02c5dcdb419bcbcfd39f Binary files /dev/null and b/sigs/datacompliance/dataset-reviewer/readme_src/Database.png differ diff --git a/sigs/datacompliance/dataset-reviewer/readme_src/hierarchical-architecture.png b/sigs/datacompliance/dataset-reviewer/readme_src/hierarchical-architecture.png new file mode 100644 index 0000000000000000000000000000000000000000..351ee97d7d200cc641785a7ea08ddb322333dfd2 Binary files /dev/null and b/sigs/datacompliance/dataset-reviewer/readme_src/hierarchical-architecture.png differ diff --git a/sigs/datacompliance/dataset-reviewer/readme_src/werkzeug1.png b/sigs/datacompliance/dataset-reviewer/readme_src/werkzeug1.png new file mode 100644 index 0000000000000000000000000000000000000000..786ffff346e76d53ef93876bbf465716925e140f Binary files /dev/null and b/sigs/datacompliance/dataset-reviewer/readme_src/werkzeug1.png differ diff --git a/sigs/datacompliance/dataset-reviewer/readme_src/werkzeug2.png b/sigs/datacompliance/dataset-reviewer/readme_src/werkzeug2.png new file mode 100644 index 0000000000000000000000000000000000000000..d1852284bbc763476c0e12d3229e1d95fe990122 Binary files /dev/null and b/sigs/datacompliance/dataset-reviewer/readme_src/werkzeug2.png differ diff --git a/sigs/datacompliance/dataset-reviewer/readme_src/werkzeug_vlab.png b/sigs/datacompliance/dataset-reviewer/readme_src/werkzeug_vlab.png new file mode 100644 index 0000000000000000000000000000000000000000..3e0a65ad36e73a48cf2642f2ff14ca4aeaa4f7f4 Binary files /dev/null and b/sigs/datacompliance/dataset-reviewer/readme_src/werkzeug_vlab.png differ diff --git a/sigs/datacompliance/dataset-reviewer/requirements.txt b/sigs/datacompliance/dataset-reviewer/requirements.txt new file mode 100644 index 0000000000000000000000000000000000000000..9d9ed73122276a945f31f1f290832b8e5ffa3c79 --- /dev/null +++ b/sigs/datacompliance/dataset-reviewer/requirements.txt @@ -0,0 +1,11 @@ +Flask==1.1.2 +SQLAlchemy==1.4 +Flask-SQLAlchemy==2.5.1 +Flask-Script==2.0.6 +PyMySQL==1.0.2 +Flask-restplus==0.13 +flask_cors == 3.0.10 +xlrd == 1.2.0 +jinja2==3.0.3 +itsdangerous==2.0.1 +werkzeug==0.16.1 \ No newline at end of file diff --git a/sigs/datacompliance/merged_data/.keep b/sigs/datacompliance/merged_data/.keep new file mode 100644 index 0000000000000000000000000000000000000000..e69de29bb2d1d6434b8b29ae775ad8c2e48c5391 diff --git a/sigs/datacompliance/merged_data1.json b/sigs/datacompliance/merged_data1.json new file mode 100644 index 0000000000000000000000000000000000000000..e7d7a51f6558e7023a79a9fa81ba4239bee522ca --- /dev/null +++ b/sigs/datacompliance/merged_data1.json @@ -0,0 +1,197 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2011-2023 XIANGHA.COM", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "美食杰文化传媒有限公司版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": " 食品伙伴网拥有本网站内所有信息内容(除食品伙伴网会员发布的商品信息外,包括但不限于文字、图片、软件、音频、视频)的版权。\\n\\n 任何被授权的浏览、复制、打印和传播属于本网站内信息内容都不得用于商业目的且所有信息内容及其任何部分的使用都必须包括此版权声明; \\n\\n 食品伙伴网(www.foodmate.net)所有的产品、技术与所有程序均属于食品伙伴网知识产权。“foodmate”、 “食品伙伴网”、其他产品服务名称及相关图形、标识等为食品伙伴网的知识产权。未经食品伙伴网许可,任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载)使用。否则,食品伙伴网将依法追究法律责任。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "重申本站之禁止行为\\n  1)用户不得截获、篡改、收集、储存厨 studio/专栏/电子书等内容;\\n\\n  2)用户不得对厨 studio/专栏/电子书等内容,以文字、录音、截图、录屏等方式,用于公开使用或提供给第三方使用;\\n\\n  3)用户不得以其他方式侵犯本平台及平台之合作方知识产权;\\n\\n  4)账号使用须遵循自用原则,禁止转让、共享账号。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright© 2005-2023", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2023 xinshipu.com, all rights reserved.", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2011-2023 XIANGHA.COM", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "4.1 您应在遵守本协议、法律法规及其他规范性文件的前提下访问和使用我们的产品及/或服务。您同意,您不会进行或利用我们的产品及/或服务进行下列活动(也不为他人进行下列活动提供便利和支持):\\n\\n4.1.1 以任何方式危害未成年人及/或其他人;\\n\\n4.1.2 从事侵犯我们或他人合法权益的活动或违法犯罪活动,包括为上述活动提供帮助;\\n\\n4.1.3 未经我们及他人(如涉及)事先明确书面许可,自行或委托他人以任何方式(包括但不限于机器人软件、蜘蛛软件、爬虫软件等任何自动程序、脚本、软件)获取平台的服务、内容、数据(包括但不限于业务数据和用户的个人信息);\\n\\n4.1.4 规避、移除、更改、阻碍、破坏或以其他方式扰乱我们用于保护我们的产品及/或服务的安全措施;\\n\\n4.1.5 未经我们明确授权,采用收费或免费的方式,在任何公开场合全部或部分展示我们的产品及/或内容(但如您的上述行为不构成侵权的除外);", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "5. 知识产权\\n5.1\\n美食杰提供的网络服务中包含的任何文本、图片、图形、音频和/或视频资料均受版权、商标和/或其它财产所有权法律的保护,未经相关权利人同意,上述资料均不得在任何媒体直接或间接发布、播放、出于播放或发布目的而改写或再发行,或者被用于其他任何商业目的。所有这些资料或资料的任何部分仅可作为私人和非商业用途而保存在某台计算机内。美食杰不就由上述资料产生或在传送或递交全部或部分上述资料过程中产生的延误、不准确、错误和遗漏或从中产生或由此产生的任何损害赔偿,以任何形式,向用户或任何第三方负责。\\n5.2\\n任何单位或个人认为美食杰网站中的内容可能涉嫌侵犯其合法权益,可以及时向美食杰书面或邮件反馈,并提供详细侵权情况证明,美食杰在收到上述法律文件后,将会尽快移除被控侵权内容。\\n5.3\\n用户在美食杰注册之后在网站上产生的内容,即位默认美食杰拥有无偿使用权。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2011 系统之家(www.xitongzhijia.net) 版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "5、经作者授权,泡泡网声明:泡泡网旗下网站所载之作品(不含互动服务),未经过泡泡网书面授权许可,任何单位或个人不得擅自复制、链接、非法使用或转载,不得以任何方式建立镜像站点。否则,泡泡网将通过行政投诉、民事诉讼等方式追究侵权者的侵权责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "北京传奇极客管理咨询有限公司 Copyright © 2009 - 2023", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "4. 知识产权;许可\\n\\n \\n\\n(1) “中关村在线”提供的网络服务中包含的全部信息(包括但不限于任何文本、图片、音频及视频等)以及为提供服务而使用的任何软件等均受知识产权和其他相关法律保护。用户仅可以为个人和非商业目的使用“中关村在线”的网络服务。除出于使用“中关村在线”服务的目的外,未经“中关村在线”事先书面同意,用户不得以任何方式复制、转发或以其他方式使用“中关村在线”提供的网络服务中包含的任何信息。\\n\\n(2) 如果用户希望复制、转发或以其他方式使用“中关村在线”网站的任何内容或作品的,请与中关村在线联系:marketing@zol.com.cn。\\n\\n(3) “本协议”未授权用户使用“中关村在线”的任何商标、服务标识和域名。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本网站的内容,如文字、图形、图像、音乐、标识、图标按钮、链接、HTML编码、商标、软件和其他资料(以下统称\"资料\"),以及本网站所有资料的汇集(指收集、安排和汇编)均受著作权法、商标法和其他适用法律的保护。所有资料和资料的汇集均属本网站或本网站的内容提供者或客户的专有财产。未经授权擅自使用任何资料将违反著作权法、商标法和其他适用法律。如果您复制任何资料,您必须在复制件上保留原资料中有关版权、商标、服务标志以及其他专有权的告示。您只能复制一份资料,并且除非这些资料另有具体规定,复制件仅可用在私人、非商业用途。未经本网站事先的书面同意,您不得为了任何公共或商业目的销售或更改资料,或者复制、重制、再版、上载、下载、登载、传送、显示、公开执行或以任何方式发送资料,或将资料存储于检索系统,或以其他任何方式使用资料。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本站所有文章均为作者本人创作,版权为作者所有,除非取得作者的明确授权,一律谢绝全文转载于其他网站。请尊重我们的劳动、自觉遵守规则。您有意无意的转载,伤害的不仅是一个人的创作热情。本站并非随意的娱乐性质站点,而是正式的科学性质网站!我们需要尽最大的努力保证内容的正确性,为了避免错误的知识在转载过程中以讹传讹,最终误导他人,请在向他人推荐时仅仅给出文章内容摘要和网址,而不要采用复制全文的传播方式。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权声明\\n\\n南方财富网独立拥有原创内容的版权(注明引用他方的图片内容除外),未经南方财富网明确书面许可,任何人不得对该内容进行复制、修改再使用、传播,或在非南方财富网所属的服务器上做镜像处理。\\n\\n凡来源非“南方财富网”的内容,均为转载、整理或用户投稿(包括但不限于文本、图片、数据、观点、建议等内容),其目的在于促进信息传播及交流,并不代表本网赞同其观点或对其内容的真实性负责。如其他媒体、单位或个人从本网下载使用,应予保留本网注明的“来源”,并自负版权等法律责任。\\n\\n另外,部分内容或没有作者署名,或署名错误,致使本网无法联系作者本人,亦无法通过事先许可的方式获得授权。同时,由于网络信息量巨大,在取得作者授权方面亦难免出现遗漏。如本网转载、整理及投稿的内容涉及版权问题,请作者持相应版权证明与本网联系做删除处理。联系邮箱:jubao@southmoney.com", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "浙江同花顺基金销售有限公司版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "新浪公司独立拥有或与相关内容提供者共同拥有新浪网站内相关内容(包括但不限于文字、图片、音频、视频资料及页面设计、编排、软件等)的版权和/或其他相关知识产权。“新浪网”、“sina”为新浪公司及其关联公司的注册商标,受中国法律保护。\\n除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\\n违反上述声明而给新浪公司造成损失的,新浪公司将依法追究其法律责任。\t", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2004-2023 64365.com版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2004-2023 法律快车", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2003-2023 找法网", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "严禁采集,违者必究\\n©2004-2022 m.64365.com All Rights Reserved", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "法邦版权本网站包含之所有内容:文本、图形、LOGO、创意、及软件等之所有权归属法邦网及本网站的内容/信息提供者,受中国及国际版权法的保护。对本网站上所有内容之复制(意指收集、组合和重新组合),本网站享有排他权并受中国及国际版权法的保护。本网站使用的所有软件的所有权归属于法邦网或它的软件供应商并受中国及国际版权法的保护。在本网站上的内容和软件可以用作信息获取网上交易及网上拍卖的信息资源,对本网站该等内容的任何其他使用,包括再造、修改、发布、转发、再版、演示或播出被严格禁止。转载文章凡本网注明“来源:法邦网”的所有作品,版权均属于法邦网,未经授权不得转载、摘编或利用其它方式使用上述作品。已经授权使用作品的,应在授权范围内使用,并注明“来源:法邦网”。违反上述声明者,本网将追究其相关法律责任。\\n\\n凡本网注明“来源:XXX(非法邦网)”的作品,均转载自其它媒体,版权归原作者及网站所有,转载的目的是为公众提供免费的法律资讯,普及法律知识,服务社会公众,并不代表本网赞同其观点和对其真实性负责。如果您对本网转载文章版权的归属存有异议或有其他任何问题,请与我们联系。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "第九条\\n\\n用户不得对本网站服务的任何部分或本网站服务之使用以及获得,进行复制、拷贝、出售、转售或用于任何其它商业目的。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "\\n三、知识产权\\n\\n为了向用户提供高质量的信息,“什么值得买” 管理员有权对用户发表的内容进行合理的编辑和修改。用户在“什么值得买”上发表的全部内容,著作权归其本人和 “什么值得买”运营公司共同所有。用户和“什么值得买”均可授权第三方以任何方式使用该内容,不需要得到对方的同意。他人未经明确授权,不得使用该内容。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2013-2023. diyiyou.com All Rights Reserved.", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "7. 禁止用户利用BOSS直聘平台从事其他的违法行为,包括但不限于:\\n\\n利用BOSS直聘提供的开聊服务从事欺诈、传销、刷流量、好评、违法物品营销等行为;\\n冒用、混淆他人账号的昵称、头像、企业介绍发布招聘信息的,或冒充、利用他人名义对外招聘的;\\n可能存在拖欠或未依法支付薪资或劳务报酬等可能损害劳动者或劳务人员合法权益的行为;\\n未经BOSS直聘公司的许可自行或授权、允许、协助任何第三人对平台内的任何信息内容进行非法获取;“非法获取”是指采用包括但不限于“蜘蛛”(spider)程序、爬虫程序、拟人程序等非真实用户或避开、破坏技术措施等非正常浏览的手段、方式,读取、复制、转存、获得数据和信息内容的行为;\\n为他人提供自动登录到本平台、代办或协助他人代办身份认证的服务或代售身份认证所需的相关材料或凭据。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "4.3 通过任何技术手段侵入平台的软件、网站、数据库等系统,非法抓取平台数据或者干扰猎聘产品和/或服务正常运行的。非法抓取是指采用程序或者非正常浏览等技术手段获取内容数据的行为,包括但不限于采用“蜘蛛”(spider)程序、爬虫程序、拟人程序等非真实用户或避开、破坏技术措施等非正常浏览的手段、方式,读取、复制、转存、获得数据和信息内容的行为;\\n\\n4.4 任何利用自有或第三方的插件或程序盗链、抓取、读取、模拟下载、深度链接、收集平台展示的任何信息的;\\n\\n4.5 侵犯猎聘或第三方的专利权、著作权、商标权、名誉权或其他任何合法权益的行为;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "第六章 版权声明\\n\\n第四十一条 本网站除因站务管理需要并已获得网站授权而由网站管理人员发布的公告类帖文外,任何会员(包括本站各级管理人员)发表的文章或图片仅代表作者本人观点,与本网站立场无关,作者文责自负。\\n第四十二条 任何会员的合法言论、文章及图片一经在本站发表,该作品的版权,除署名权、发表权、修改权、保护作品完整权归原作者享有外,其他权益即无偿转归本站独占所有,除本站外的任何单位或个人未经本站的正式授权许可不得以任何方式使用上述作品。\\n第四十三条 前款所指的“其他权益”包括但不限于:通过复制、发行、信息网络传播、改编、翻译、汇编及应由版权人享有的其他方式使用上述作品并获得报酬的财产权利,以及许可他人以上述方式使用并获得报酬的权利。\\n第四十四条 前款述及的由本站独占所有的各项权利涵盖本站已经发布或将要发布的所有内容(包括但不限于:文字、图片、图像、音频、视频等),任何单位或个人不得以任何方式(包括但不限于:转载、摘编、复制、剪辑等)擅自使用上述内容,或利用这些内容再造与之相关的衍生作品。\\n第四十五条 任何转载、引用发表于本站的版权文章须符合以下规范:\\n(1) 用于非商业、非盈利、非广告性目的时需注明作者及作品的出处为\"职朋\"。\\n(2) 用于商业、盈利、广告性目的时需征得网站和作品原作者的同意,并注明作者姓名、授权范围及原作出处\"职朋\"。不得未经作者同意而剽窃、引用本网站的任何版权作品,否则本网站将保留按相关法律程序替原著作者追究侵权责任单位或个人的权利。\\n(3) 任何作品的修改或删除均应保持作者原意并征求原作者同意,并注明授权范围。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "13.未经店长直聘公司的许可,以任何母的自行或授权、允许、协助任何第三人对平台内的任何信息内容进行非法获取,用于商业用途或其他任何目的。“非法获取”是指采用包括但不限于“蜘蛛”(spider)程序、爬虫程序、拟人程序等非真实用户或避开、破坏技术设施等非正常浏览的手段、方式,读取、复制、转存、获得数据和信息内容的行为;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "职朋职业圈版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2010-2020 zx123.cn", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "2.土巴兔提示您,您通过自身账号在接受土巴兔的各项服务中所上传、发送的任何内容都应具有合法来源,如相关内容涉及任何第三方的合法权益,应事先获得相应的许可。如土巴兔收到涉及您的相关举报或投诉,土巴兔可采取相关法律法规所要求或允许的方式,向相关争议方、相关部门提供包括账号在内的必要的信息,以便解决纠纷争议,保护正当权利人的合法权益。\\n\\n3.除非法律允许或土巴兔书面许可,您使用本网站过程中不得从事下列行为:\\n\\n(1)删除本网站及其副本上关于著作权的信息;\\n\\n(2)对本网站进行反向工程、反向汇编、反向编译,或者以其他方式尝试发现本网站的源代码;\\n\\n(3)对土巴兔拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等;\\n\\n(4)对本网站或者本网站运行过程中释放到任何终端内存中的数据、网站运行过程中客户端与服务器端的交互数据,以及本网站运行所必需的系统数据,进行复制、修改、增加、删除、挂接运行或创作任何衍生作品,形式包括但不限于使用插件、外挂或非经土巴兔授权的第三方工具/服务接入本网站和相关系统;\\n\\n(5)通过修改或伪造网站运行中的指令、数据,增加、删减、变动网站的功能或运行效果,或者将用于上述用途的软件、方法进行运营或向公众传播,无论这些行为是否为商业目的;\\n\\n(6)通过非土巴兔开发、授权的第三方软件、插件、外挂、系统,登录或使用本网站及服务,或制作、发布、传播上述工具;\\n\\n(7)自行或者授权他人、第三方软件对本网站及其组件、模块、数据进行干扰;\\n\\n(8)自行转载他人文章或者上传他人设计作品时未事先征得原作者同意并注明原作者姓名出处及版权仅归原作者所有。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本网站的内容,如文字、图形、图像、音乐、标识、图标按钮、链接、HTML编码、商标、软件和其他资料(以下统称\"资料\"),以及本网站所有资料的汇集(指收集、安排和汇编)均受著作权法、商标法和其他适用法律的保护。所有资料和资料的汇集均属本网站或本网站的内容提供者或客户的专有财产。未经授权擅自使用任何资料将违反著作权法、商标法和其他适用法律。如果您复制任何资料,您必须在复制件上保留原资料中有关版权、商标、服务标志以及其他专有权的告示。您只能复制一份资料,并且除非这些资料另有具体规定,复制件仅可用在私人、非商业用途。未经本网站事先的书面同意,您不得为了任何公共或商业目的销售或更改资料,或者复制、重制、再版、上载、下载、登载、传送、显示、公开执行或以任何方式发送资料,或将资料存储于检索系统,或以其他任何方式使用资料。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2016-2021k.jinbaodm.com .All Rights Reserved .\\n\\n本站所有资源均收集于互联网其它网站,本站不提供影片资源存储,也不参与录制、上传,若本站收录的节目无意侵犯了贵司版权,请留言,我们会及时处理断开连接,谢谢。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2022 朵朵女性网 ddnx.com版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data10.json b/sigs/datacompliance/merged_data10.json new file mode 100644 index 0000000000000000000000000000000000000000..188e66a8c08896e74a84c8eb6b8c10e517b679e2 --- /dev/null +++ b/sigs/datacompliance/merged_data10.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2002-2017 可可诗词网 版权所有 ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2021 WWW.JIEYAN8.CN 版权所有", + "output": "这是古诗词类数据,属于公共领域知识,风险低" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 北京中教双元科技集团有限公司 EOL Corporation  除非中国法律另有规定,未经中国教育在线书面许可,对于中国教育在线拥有版权或其他知识产权的任何内容,任何人不得复制或在非中国教育在线所属的服务器上做镜像或以其他任何方式进行使用。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright© 2019-2023 弈方广告 86历史网 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "诗词吾爱网 ©2009-2023 任何转载、引用发表于本网站的版权文章须符合以下规范:\\n    (1)征得文章或图片原作者同意,注明作者及文章及图片的出处为\"诗词吾爱网\"(www.52shici.com),并向作者支付稿酬。\\n    (2)任何文章或图片的修改或删除均应保持作者原意并征求原作者同意,并注明授权范围。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权 北京中教双元科技集团有限公司 Corporation 除非中国法律另有规定,未经中国教育在线书面许可,对于中国教育在线拥有版权或其他知识产权的任何内容,任何人不得复制或在非中国教育在线所属的服务器上做镜像或以其他任何方式进行使用。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 完美知识 版权所有 未经完美知识事先书面许可,任何人不得擅自使用、监视、复制、传播、展示、镜像、上传、下载全历史软件及相关服务中的内容(也包括通过任何机器人、蜘蛛等程序或设备进行操作)。未经完美知识事先书面许可,除5.6条规定的情况外,您不得以任何营利性或非营利性的目的修改、复制、传播、传送、发行、转移、销售全历史产品与/或服务所使用的知识产权或创造、制作与其有关的派生产品或衍生品或者利用全历史产品与/或服务之部分或全部向任何第三方提供服务或产品。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权 北京中教双元科技集团有限公司 Corporation 除非中国法律另有规定,未经中国教育在线书面许可,对于中国教育在线拥有版权或其他知识产权的任何内容,任何人不得复制或在非中国教育在线所属的服务器上做镜像或以其他任何方式进行使用。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有北京中教双元科技集团有限公司EOL Corporation", + "output": "这是古诗词类数据,属于公共领域知识,风险低" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权 北京中教双元科技集团有限公司 Corporation 除非中国法律另有规定,未经中国教育在线书面许可,对于中国教育在线拥有版权或其他知识产权的任何内容,任何人不得复制或在非中国教育在线所属的服务器上做镜像或以其他任何方式进行使用。", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2000-2020 Dunhuangtour.com Inc. All rights reserve ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2023 Airbnb, Inc. All rights reserved 未经我们同意,请勿使用、复制、显示、镜像或嵌置爱彼迎平台、任何内容、任何爱彼迎品牌或任何页面布局或设计", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 1997-2023 网易公司版权所有 除非法律允许或网易公司书面许可,用户使用网易服务的过程中不得从事下列行为:(3) 对网易公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996 - 2023 SINA Corporation, All Rights Reserved 未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中央广播电视台 央视网 版权所有 任何第三方不得歪曲和篡改本网所呈现的内容。未经本网授权,任何第三方不得擅自引用、复制、转载、摘编或以其他任何方式非法使用本网站所呈现的内容。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "2004-2023 © 穷游网® qyer.com All rights reserved. 本网站上刊载的所有内容以及本网站用户发表并授权刊载于本网站的所有内容,包括但不限于文字、图片、声音、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序、数据、数据文件、发现、发明、作品、设计、技术、方法、流程、计划、公式、专栏目录与名称、内容分类标准、过去、目前和计划的研究开发成果以及任何其他信息或资料,均受中国现行法律法规、规章制度及适用之国际公约中有关着作权、商标权、专利权及/或其它财产所有权法律的保护,为本公司所有。使用者将本网站上刊载的内容与服务用于商业、盈利、广告性目的时,需征得本公司的书面特别授权,注明作者及文章出处并按有关规定支付相应费用。未经本公司的明确书面特别授权,任何人不得为任何目的使用以及向任何自然人或单位提供、披露、复印、复制、出售、出让、许可、营销、出版、宣讲、转让、处置或利用本网站上提供的任何内容或服务", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2023 Mafengwo.cn 不得对马蜂窝上的任何数据作商业性利用,包括但不限于在未经马蜂窝事先书面同意的情况下,以复制、发布、传播等任何方式使用马蜂窝上展示的资料;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data11.json b/sigs/datacompliance/merged_data11.json new file mode 100644 index 0000000000000000000000000000000000000000..bb0d62d88c124e6b0aa837f29e3d23a528471be1 --- /dev/null +++ b/sigs/datacompliance/merged_data11.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2003-2023 dianping.com, All Rights Reserved. 本站发布的所有内容,未经许可,不得转载", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "2004-2023 © 穷游网® qyer.com All rights reserved. 本网站上刊载的所有内容以及本网站用户发表并授权刊载于本网站的所有内容,包括但不限于文字、图片、声音、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序、数据、数据文件、发现、发明、作品、设计、技术、方法、流程、计划、公式、专栏目录与名称、内容分类标准、过去、目前和计划的研究开发成果以及任何其他信息或资料,均受中国现行法律法规、规章制度及适用之国际公约中有关着作权、商标权、专利权及/或其它财产所有权法律的保护,为本公司所有。使用者将本网站上刊载的内容与服务用于商业、盈利、广告性目的时,需征得本公司的书面特别授权,注明作者及文章出处并按有关规定支付相应费用。未经本公司的明确书面特别授权,任何人不得为任何目的使用以及向任何自然人或单位提供、披露、复印、复制、出售、出让、许可、营销、出版、宣讲、转让、处置或利用本网站上提供的任何内容或服务", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 @太平洋汽车 未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2013-2023 华夏EV网 版权所有 若有关媒体、网站或个人从本网站下载使用文章、图片等相关信息,请在转载、使用该等信息时务必尊重该信息的版权或相关权利,保留本网站注明的“稿件来源”,并自行承担版权、商标权等法律责任;若擅自篡改或以其他方式损害来源为“华夏EV网”网站的相关信息,本网站保留追究其法律责任的权利用途。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "CopyRight © 2000-2023 BitAuto,All Rights Reserved. 易车提供的网络服务中所包含的任何文字、软件、图片、图形、图表、网页、音频、视频、域名等相关内容均受中国版权、商标及/或其他财产所有权等法律、法规及/或国际公约的保护,对为提供网络服务而使用的任何软件的一切权利均属于该软件的著作权人,未经易车或相关权利人同意,任何人均不得在任何媒体、任何场合直接或间接发布、使用、修改和再使用;易车不对由上述资料产生或在传送、递交全部或部分上述资料,使用相关软件过程中产生的延误、不准确、错误和遗漏或由此产生的任何损害进行赔偿,亦无需以任何形式向用户或任何第三方负责。同时,经易车书面同意进行转载的,转载人应标明相关内容出处及原作者相关信息。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有:车主之家(www.16888.com) 除本协议明确规定外,未经车主之家事先明确书面同意,您不可以任何方式 (包括“镜像”) 将车主之家的任何部分及任何内容复制、再制、重印、上传、发布、公开展示、编码、翻译、传输或散布至任何其他计算机、服务器、网站、客户端或其他媒介。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 @太平洋汽车 未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "@2011-2023 www.autotimes.com.cn ALL Rights Reserved. 汽车时代网 未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2007 - 2023 58che.com All Rights Reserved. 版权所有 北京五八汽车科技股份有限公司 用户不得对他人张贴在公开使用区域或本服务其他内容进行复制、出售或用作其他商业用途。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2009 - 2023 www.360che.com All Rights Reserved.北京卡车之家信息技术股份有限公司 版权所有 未经卡车之家的明确书面许可,任何第三方不得为任何非私人或商业目的获取或使用卡车之家网站的任何部分或通过卡车之家网站可直接或间接获得的任何内容、服务或资料。任何第三方违反本协议的规定以任何方式,和/或以任何文字对卡车之家的任何部分进行发表、复制、转载、更改、引用、链接、下载或以其他方式进行使用", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2002-2023 www.xcar.com.cn All rights reserved. 北京智德典康电子商务有限公司(爱卡汽车) 版权所有 未经本公司事先书面同意,用户不得以任何方式复制、转发或以其他方式使用“爱卡汽车”提供的网络服务中包含的任何信息。\\n", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "CopyRight © 2000-2023 BitAuto,All Rights Reserved. 版权所有 北京易车信息科技有限公司 易车提供的网络服务中所包含的任何文字、软件、图片、图形、图表、网页、音频、视频、域名等相关内容均受中国版权、商标及/或其他财产所有权等法律、法规及/或国际公约的保护,对为提供网络服务而使用的任何软件的一切权利均属于该软件的著作权人,未经易车或相关权利人同意,任何人均不得在任何媒体、任何场合直接或间接发布、使用、修改和再使用", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 @太平洋汽车 未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright Notice © 2016 Gasgoo.com Corporation and its licensors. All rights reserved. User, by accepting this Agreement, agrees and acknowledges, will not copy, reproduce or download any information, text, images, video clips, directories, files, databases or listings available on Sites, for the purpose of re-selling or re-distributing Sites content, mass mailing, or otherwise commercially exploiting Sites content without written permission from Gasgoo.com. ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996 - 2023 SINA Corporation, All Rights Reserved 未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "凤凰新媒体版权所有Copyright © 2019 Phoenix New Media Limited All Rights Reserved. 凤凰网提供的会员服务内容(包括但不限于文字、照片、图形、图像、图表、声音、FLASH 动画、视频、音频等)的知识产权均属于凤凰网所有,或由第三方授权使用。会员不能擅自复制、改编这些内容、或创造与内容有关的衍生产品。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 1997-2023 网易公司版权所有 除非法律允许或网易公司书面许可,用户使用网易服务的过程中不得从事下列行为:(3) 对网易公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等;", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2018-2022 焉知 All Right Reserved ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2013-2014 银河演员网(演员表,演员网) All Rights Reserved.", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "已无法访问" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data12.json b/sigs/datacompliance/merged_data12.json new file mode 100644 index 0000000000000000000000000000000000000000..39e4ac8e7c57c80849ee8a7437bc5d0069a1bfec --- /dev/null +++ b/sigs/datacompliance/merged_data12.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2007-2020 ZDFACE Corporation 浏览者可以下载本网站上显示的资料,但这些资料只限用于个人学习研究使用,不得用于任何商业用途,无论是否在资料上明示,所有此等资料都是受到版权法的法律保护。浏览者没有获得妆点网(www.zdface.com)或各自的版权所有者明确的书面同意下,不得分发、修改、散布、再使用、再传递或使用", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996 - 2023 SINA Corporation, All Rights Reserved 未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。 ", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2014, Qule Technology Co. Ltd. All Rights Reserved. 北京趣乐科技有限公司 用户不得擅自删除、掩盖或更改弹琴吧的版权声明、商标或其它权利声明。弹琴吧平台所有设计图样以及其他图样、产品及服务名称,均为弹琴吧所享有的商标、标识。任何人不得使用、复制或用作其他用途。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "北京酷我科技有限公司版权所有 除非法律允许或酷我公司书面许可,用户不得从事下列行为,否则,酷我公司将保留依法追究注律责任的权利: (2)对软件进行反向工程、反向汇编、反向编译或者以其他方式尝试发现软件的源代码(3)对酷我公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2020 吉他社 除非另有约定或我方另行声明,我方平台所有:产品外观、网站图片、技术、软件、数据等其他信息,未经相关权利人同意,上述资料均不得在任何媒体直接或间接发布、播放、出于播放或发布目的而改写或再发行,或者被用于其他任何商业目的。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2005 - 2023 咪咕音乐有限公司 除非另有约定或咪咕公司另行声明,咪咕产品内的所有内容(用户自行上传和咪咕公司合作伙伴依法享有权利的内容除外)、技术、软件、程序、数据及其他信息(包括但不限于文字、图像、图片、照片、音频、视频、图表、色彩、版面设计、电子文档)的所有知识产权(包括但不限于著作权、商标权、专利权、商业秘密等)及相关权利,均归咪咕公司所有。未经咪咕公司许可,任何人不得擅自使用(包括但不限于复制、传播、展示、镜像、上传、下载、修改、出租)", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 1997-2023 网易公司版权所有 除非法律允许或网易公司书面许可,用户使用网易服务的过程中不得从事下列行为:(3) 对网易公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2004-2023 KuGou-IncAll Rights Reserved 除非法律允许或酷狗书面许可,用户不得从事下列行为,否则,酷狗将保留依法追究法律责任的权利:(3)对酷狗拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "北京酷我科技有限公司版权所有 除非法律允许或酷我公司书面许可,用户不得从事下列行为,否则,酷我公司将保留依法追究注律责任的权利: (2)对软件进行反向工程、反向汇编、反向编译或者以其他方式尝试发现软件的源代码(3)对酷我公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2005-2023 liuxue86.com All rights reserved.出国留学网 版权所有 本站所有内容,凡注明“原创文章、图片、视频”等,版权均属出国留学网所有,任何自然人、法人未经本站授权不得转载、链接、复制等方式发布,如需使用,必须注明来源,“转自(或来源)出国留学网(www.liuxue86.com )”,版权归出国留学网所有,如有侵权将追究法律责任。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2016 帮学教育 不得侵犯考研帮所有著作权、版权;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "CopyRight @2020 答案网 www.zqnf.com All Rights Reserved  任何个人、组织、网站只有在获得答案网(www.zqnf.com)或其他相关权利人的授权之后才能使用这些内容,而不能擅自复制、再造这些内容或创造与内容有关的派生产品。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright www.zhakao.cn Inc. All 未经授权,禁止转载,违者必究!", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2019 shuashuati.com 不得将本产品用于商业目的的活动之中。任何商业目的的复制、分发、传播、展示必须经得北京深远思维科技的另外许可,如捆绑、赠送、销售、集成、将本产品作为为他人提供服务的工具等。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "copyright © 2010-today pxto.com.cn, All Rights Reserved. 任何被授权的浏览、复制、打印和传播属于本网站内信息内容都不得用于商业目的且所有信息内容及其任何部分的使用都必须包括此版权声明;", + "output": "已无法访问" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data13.json b/sigs/datacompliance/merged_data13.json new file mode 100644 index 0000000000000000000000000000000000000000..b86980a6ec25be45ebeae3dff53686d1287332bb --- /dev/null +++ b/sigs/datacompliance/merged_data13.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © dongao.com Inc. All Rights Reserved天津东奥时代培训学校有限公司版权所有 已获得书面授权,可以使用东奥拥有版权和/或其他相关知识产权的任何内容及商标标识的公司及个人使用上述内容时必须注明来源。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 © 98作文大全网(98zw.com) ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright ©2001-2023 无忧考网版权所有 (北京无忧世纪科技有限公司旗下网站) All Rights Reserved. 无忧考网授权您观看和本网站(简称\"站\")上的内容,但仅供您个人而非商业使用,而且,对于原始内容中所含的版权和其他所有权声明,您必须在其副本中予以保留。您不得以任何方式修改、复制、公开展示、公布或分发这些材料或者以其他方式把它们用于任何公开或商业目的。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "北京六智信息技术股份有限公司 Copyright © 2005-2023 360doc.com , All Rights Reserved 未经个人图书馆事先许可,禁止使用任何机器人、蜘蛛、其他自动设备,或手动程序来监视或复制个人图书馆网页或其所包含的任何内容。否则,个人图书馆有权依法追究法律责任。\\n【附则】", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2001-2023zuowen.net版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2013-2022 www.sodocs.net", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 成都中品网络科技有限公司 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2005-2023 liuxue86.com All rights reserved.出国留学网 版权所有 本站所有内容,凡注明“原创文章、图片、视频”等,版权均属出国留学网所有,任何自然人、法人未经本站授权不得转载、链接、复制等方式发布,如需使用,必须注明来源,“转自(或来源)出国留学网(www.liuxue86.com )”,版权归出国留学网所有,如有侵权将追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2003 - 2023JSYKS.COM All Rights Reserved. 版权:南京元贝信息技术有限公司 不得为商业目的而复制、出售、转售或利用本服务的任何部分、本服务的使用或本服务的接入。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2007-2023 Houxue.com 版权所有. 江苏厚学网信息技术股份有限公司.", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright ©2001-2023 无忧考网版权所有 (北京无忧世纪科技有限公司旗下网站) All Rights Reserved. 无忧考网授权您观看和本网站(简称\"站\")上的内容,但仅供您个人而非商业使用,而且,对于原始内容中所含的版权和其他所有权声明,您必须在其副本中予以保留。您不得以任何方式修改、复制、公开展示、公布或分发这些材料或者以其他方式把它们用于任何公开或商业目的。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2023 大众信息网 版权所有 您同意,您不得对任何资料作商业性利用,包括但不限于在未经大众信息网授权高层管理人员事先书面批准的情况下,复制在大众信息网网站上展示的任何资料并用于商业用途。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "任何未被授权的浏览、复制、打印和传播属于19楼互联网社区的信息内容,都不得用于商业目的,且所有信息内容及其任何部分的使用都必须包括此版权声明;已经书面授权的,应在授权范围内使用,并注明\"来源:19楼互联网社区\"。违反上述声明者,以侵权论,19楼可以其自己的名义主张权利,包括但不限于提出交涉、投诉、向人民法院提起诉讼等,将依法追究其相关法律责任。\\n", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2006-2023 All rights reserved. 本地宝 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2011-2023 8684.com 任何单位或个人不得以任何方式,以任何文字对8684本地生活的资料作全部和局部复制、转载、引用和链接。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data14.json b/sigs/datacompliance/merged_data14.json new file mode 100644 index 0000000000000000000000000000000000000000..1720d3f11fa473aaae58973d07876ad493138263 --- /dev/null +++ b/sigs/datacompliance/merged_data14.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1999-2023 C114 All Rights Reserved | Discuz Licensed 不得利用本站制作、复制和传播下列信息:(十)进行商业广告行为的。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2004-2023 www.autohome.com.cn All Rights Reserved. 汽车之家 版权所有 经作者授权,汽车之家声明:汽车之家旗下网站所载之作品(不含互动服务),未经过汽车之家书面授权许可,任何单位或个人不得擅自复制、链接、非法使用或转载 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": " ©2023 中关村在线 版权所有 除出于使用“中关村在线”服务的目的外,未经“中关村在线”事先书面同意,用户不得以任何方式复制、转发或以其他方式使用“中关村在线”提供的网络服务中包含的任何信息。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright ©2021 KUANGHUI All Rights Reserved. 匡慧公司 版权所有 未经虎扑书面许可,任何人或机构,不得自行或授权、允许、协助其他人或机构复制、读取、抓取或采用虎扑相关软件或服务中的任何信息内容(亦不可擅自编辑修改后使用),用于包括但不限于宣传、增加阅读量、浏览量等商业用途。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中国工控网(gongkong.com)版权所有© Copyright 不得对本公司及网站的页面内容进行复制、修改、展示、公开传播等及其他任何商业目的的使用。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2004-2023 YW11.COM. 起名网 All Rights Reserved 对于已经授权本站独家使用提供给本站资料的版权所有人的文章、图片等资料,如需转载使用,需取得本站和版权所有人的同意。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有©解梦吧 2006-2014 ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2023 . All rights reserved. 1997-2023 粤ICP备2023016683号-1公司版权所有", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "copyright © 2005-2023 www.d1xz.net 第一星座网 版权所有 其他媒体如需转载需按对方标准支付稿酬并标注来源(第一星座网)并链接至(3g.d1xz.net)第一星座网首页。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 杭州火烧云科技有限公司 您和婚礼都应当遵守法律规定,不得侵犯对方以及其他第三人的知识产权权利", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "copyright©2008-2022 3g.d5168.com 周新春易学网 版权所有 ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "CopyRight © 2008-2023 小百通网 All Rights Reserved.", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2023 小娃子 版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2023 词林在线词典", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2018 All Rights Reserved", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2022中国知网(CNKI) 未经中国知网或广告商明示授权,您不得修改、出租、出借、出售、散布本服务或软件之任何部分或全部,或据以制作衍生著作,或使用擅自修改后的软件等。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data15.json b/sigs/datacompliance/merged_data15.json new file mode 100644 index 0000000000000000000000000000000000000000..9cafa17b3bb2ff8cd5b061d1d88555f5d9297756 --- /dev/null +++ b/sigs/datacompliance/merged_data15.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "六维联合信息科技 (北京) 有限公司©版权所有 未经六维公司书面授权许可不得以任何方式(包括但不限于复制本软件系统的部分或者全部;破解本软件系统等加密措施;爬取本软件系统文献数据等)侵犯掌桥科研软件系统著作权及其他相关合法权益", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有© 2001-2023 经由服务传送的信息及内容受到法律的保护,用户未经许可不得进行复制、修改、出租、传播、衍生其它作品及用于商业目的。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2023 一站阅读 - 蜀ICP备09001226号-1, All Rights Reserved. ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2023 ybzhan.cn All Rights Reserved 未经兴旺宝明通事先书面许可,禁止使用任何机器人、蜘蛛、其他自动设备,或手动程序来监视或复制兴旺宝明通网页或其所包含的任何内容。否则,我们有权依法追究法律责任。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2006-2023 深圳市天助人和信息技术有限公司 版权所有 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2003 - 2023 testmart.cn All Rights Reserved 仪器仪表交易网 版权所有 对本网站上的内容和软件可以作为信息资源获取,但不得对本网站的内容进行再造、修改、发布、转发、再版、演示或播出等。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2009-2023 spzs.com 用户只有在获得食品招商网或其他相关权利人的授权之后才能使用这些内容,而不能擅自复制、再造这些内容,或创造与内容有关的派生产品。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2023 www.jqw.com 版权所有 浏览者可以下载本网站上显示的资料,但这些资料只限用于个人学习研究使用,不得分发、修改、散布、再使用、再传递或使用本网站的内容用于任何公众商业用途。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "企博网 版权所有 © 2006-2025 除法律另有强制性规定外,未经企博网或相关权利人许可,任何单位或个人不得以任何形式非法地全部或部分复制、转载、引用、链接、抓取、反向工程、反向编译、反汇编或以其他方式使用企博网或相关权利人提供的网络服务中包含的任何文本、图片、图形、音频和/或视频资料等信息内容", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2007-2023  www.anjuke.com All Rights Reserved 安居客平台以下内容不可任意转载:\\n\\n1)本平台内发布的所有信息;\\n\\n2)已作出不得转载或未经许可不得转载声明的内容;\\n\\n3)本平台中特有的图形、标志、页面风格、编排方式、程序等;\\n\\n4)本平台中必须具有特别授权或具有注册用户资格方可知晓的内容;\\n\\n5)其他法律不允许或本平台认为不适合转载的内容。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "2015 CBS Interactive.万维家电网 版权所有 除出于使用“万维家电网”服务的目的外,未经“万维家电网”事先书面同意,用户不得以任何方式复制、转发或以其他方式使用“万维家电网”提供的网络服务中包含的任何信息。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2008-2023 南京九六零网络科技有限公司 版权所有 除非有相反证据证明外,我们平台上的所有图标、标识、网页页眉、按钮图标、服务名称、文字、图片音频、视频等的知识产权及所有权均归属于我们。未经我们书面许可,任何人不得自行或提供第三方使用。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2023 ybzhan.cn All Rights Reserved 未经兴旺宝明通事先书面许可,禁止使用任何机器人、蜘蛛、其他自动设备,或手动程序来监视或复制兴旺宝明通网页或其所包含的任何内容。否则,我们有权依法追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2023 今日头条 除非得到公司事先明示书面授权,你不得以任何形式对“今日头条”软件及相关服务进行包括但不限于改编、复制、传播、垂直搜索、镜像或交易等未经授权的访问或使用。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Qiyeku版权所有 © 2006-2023 用户承诺不对企业库任何资料作商业性利用,包括但不限于在未经企业库事先书面批准的情况下,复制企业库网站上展示的任何资料,不能利用企业库各项服务进行销售或其它商业用途。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "一步电子网 版权所有 © 2005-2023 您同意,您不得对任何资料作商业性利用,包括但不限于在未经一步电子网授权高层管理人员事先书面批准的情况下,复制在一步电子网网站上展示的任何资料并用于商业用途。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2008-2023 南京九六零网络科技有限公司 版权所有 除非有相反证据证明外,我们平台上的所有图标、标识、网页页眉、按钮图标、服务名称、文字、图片音频、视频等的知识产权及所有权均归属于我们。未经我们书面许可,任何人不得自行或提供第三方使用。 ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "@2023 bestb2b.com ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2003-2023 114ic.com All Rights Reserved ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data16.json b/sigs/datacompliance/merged_data16.json new file mode 100644 index 0000000000000000000000000000000000000000..309b7227b6e399e9cfe1e8982d9122c29539dc53 --- /dev/null +++ b/sigs/datacompliance/merged_data16.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2023 Sohu.com Inc. All Rights Reserved. 搜狐公司 版权所有 任何第三方未经搜狐焦点同意,不得将用户在平台上的用户成果、所发表言论等进行复制、修改、编辑、转让、使用、通过信息网络传播或作其他用途,包括但不限于通过截取视频信号、抓取录播音频/视频、编辑视频/音频/文字和其他形式的内容等方式。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright (C) 2023 yunqi.qq.com All Rights Reserved 上海阅文信息技术有限公司 版权所有 除非事先获得阅文集团或其权利人的合法授权,您不得对任何该信息、资料、文字、软件、声音、图片、视频、图表进行修改、拷贝、散布、传送、展示、执行、复制、发行、授权、制作衍生著作、移转或销售。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2016-2023 iHuaBen.com ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright ©2017-2023 爱读小说 All Rights Reserved. ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2023 爱奇艺 All Rights Reserved 您同意,您不会进行或利用我们的产品及服务进行下列活动(也不为他人进行下列活动提供便利和支持): 4.1.5 未经我们授权,以视频采集、直播、录屏、截屏、下载后分享、转发等任何方式,将我们的产品及服务、我们平台的文字、图片、音频、视频等所有内容提供给任何第三方或在第三方平台进行传播; ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2022中国知网(CNKI) 未经中国知网或广告商明示授权,您不得修改、出租、出借、出售、散布本服务或软件之任何部分或全部,或据以制作衍生著作,或使用擅自修改后的软件等。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 1997-2023 网易公司版权所有 除非法律允许或网易公司书面许可,用户使用网易服务的过程中不得从事下列行为:(3) 对网易公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本站各栏目的作品版权属文章作者本人所有。若报刊、出版社拟选载本站各栏目的作品,请与作者本人联系。转载作品的报刊、出版社,必须按“中华人民共和国著作权法”给付稿酬并寄发样报(刊)。 如擅自转载不付稿酬,文章作者有权诉之于法。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © tongxiehui.net All Rights Reserved ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright (C) 当当网 2004-2021, All Rights Reserved 除非另外明确书面授权,您不得向任何第三方出售、出租、租赁、分发、传播、分许可或以其他任何方式转让本“软件产品”所提供的内容、服务或其任何部分享有的任何权利。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright (C) 2023 yunqi.qq.com All Rights Reserved 上海阅文信息技术有限公司 版权所有 除非事先获得阅文集团或其权利人的合法授权,您不得对任何该信息、资料、文字、软件、声音、图片、视频、图表进行修改、拷贝、散布、传送、展示、执行、复制、发行、授权、制作衍生著作、移转或销售。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright (C) 2023 book.qq.com All Rights Reserved 除非腾讯书面许可,您不得从事下列任一行为:(3)对腾讯拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 侵权必究", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2014 Heiyan.com All rights reserved. 用户无权实施包括但不限于下列行为: 用户擅自实施包括但不限于下列行为:使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版,建立镜像站点、擅自借助黑岩发展与之有关的衍生产品、作品、服务、插件、外挂、兼容、互联等; ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2023 Sohu.com Inc. All Rights Reserved. 搜狐公司 版权所有 搜狐服务中包含的任何文字、图表、音频、视频和/或软件(包括但不限于软件中包含的图表、动画、音频、视频、界面实际、数据和程序、代码、文档)等信息或材料均受著作权法、商标法和/或其它法律法规的保护,未经相关权利人书面同意,用户不得以任何方式使用该等信息或材料,但出于使用搜狐服务目的而使用的除外。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2023 Sohu.com Inc. All Rights Reserved. 搜狐公司 版权所有 任何第三方未经搜狐焦点同意,不得将用户在平台上的用户成果、所发表言论等进行复制、修改、编辑、转让、使用、通过信息网络传播或作其他用途,包括但不限于通过截取视频信号、抓取录播音频/视频、编辑视频/音频/文字和其他形式的内容等方式。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "许可证", + "output": "不确定" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 股 份 有 限 公 司 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中华人民共和国外交部 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data17.json b/sigs/datacompliance/merged_data17.json new file mode 100644 index 0000000000000000000000000000000000000000..4d129f8f8604ecafa9837ef118bde8e49e5ffdb9 --- /dev/null +++ b/sigs/datacompliance/merged_data17.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "任何组织或个人应当尊重他人的著作权,非法转载或抄袭他人文章或信息所致侵权责任自行承担,均与西陆网无关。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "来源为\"中国军网\"的均为中国军网版权所有,未经协议授权,请勿作为商业用途使用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本网站所刊载信息,不代表中新社和中新网观点。 刊用本网站稿件,务经书面授权。 未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中国西藏网版权所有,未经书面授权禁止使用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "该数据现已无法访问和获取" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "凡注明来源为“观察者网”,除与观察者网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "任何第三方不得歪曲和篡改本网所呈现的内容。未经本网授权,任何第三方不得擅自引用、复制、转载、摘编或以其他任何方式非法使用本网站所呈现的内容。\n  任何第三方不得擅自转载本网提供的信息和服务内容,如需转载,必须取得相应权利人的合法授权。经本网授权使用的,不得超越所获授权范围,且在转载时须保留原有信息和服务内容的来源。\n  任何第三方不得盗用本网名义发布信息,或擅自使用本网名义引用、转载来源不规范或权属不明晰的信息。\n  凡本网注明“来源:央视网/中国网络电视台”的所有内容,均为本网合法拥有著作权或相关权利的内容,未经本网授权,任何第三方不得转载、链接、摘编或以其他方式使用上述内容。已经本网授权使用的,应在授权范围内使用,并注明“来源:央视网/中国网络电视台”。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "除非中国法律另有规定,未经凤凰网书面许可,对于凤凰网拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非凤凰网所属服务器上做镜像处理或以其他任何方式进行使用;", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "《人民日报》(电子版)的一切内容(包括但不限于文字、图片、PDF、图表、标志、标识、商标、版面设计、专栏目录与名称、内容分类标准以及为读者提供的任何信息)仅供人民网读者阅读、学习研究使用,未经人民网股份有限公司及/或相关权利人书面授权,任何单位及个人不得将《人民日报》(电子版)所登载、发布的内容用于商业性目的,包括但不限于转载、复制、发行、制作光盘、数据库、触摸展示等行为方式,或将之在非本站所属的服务器上作镜像。否则,人民网股份有限公司将采取包括但不限于网上公示、向有关部门举报、诉讼等一切合法手段,追究侵权者的法律责任。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "该数据现已无法访问和获取" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "任何第三方不得歪曲和篡改本网所呈现的内容。未经本网授权,任何第三方不得擅自引用、复制、转载、摘编或以其他任何方式非法使用本网站所呈现的内容。\n  任何第三方不得擅自转载本网提供的信息和服务内容,如需转载,必须取得相应权利人的合法授权。经本网授权使用的,不得超越所获授权范围,且在转载时须保留原有信息和服务内容的来源。\n  任何第三方不得盗用本网名义发布信息,或擅自使用本网名义引用、转载来源不规范或权属不明晰的信息。\n  凡本网注明“来源:央视网/中国网络电视台”的所有内容,均为本网合法拥有著作权或相关权利的内容,未经本网授权,任何第三方不得转载、链接、摘编或以其他方式使用上述内容。已经本网授权使用的,应在授权范围内使用,并注明“来源:央视网/中国网络电视台”。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data18.json b/sigs/datacompliance/merged_data18.json new file mode 100644 index 0000000000000000000000000000000000000000..0aa7cdf0a58533235d6e396547575ecff1654a4d --- /dev/null +++ b/sigs/datacompliance/merged_data18.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 中国互联网信息中心", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "央广网文化传媒有限公司 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "该数据现已无法访问和获取" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "用户只能在环球网和相关权利人授权下才能使用这些内容,而不能擅自复制、发布、转载、播放、改编、汇编或以其他方式使用这些内容或将该等内容用于其他任何商业目的。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "(一)用于非商业、非盈利、非广告性目的时需注明作者及文章及图片的出处为“南方周末网”或“www.infzm.com”。\n\n(二)用于商业、盈利、广告性目的时需征得本网同意,并注明作者姓名、授权范围及原作出处“南方周末网”。不得未经作者同意而剽窃、引用本网的任何版权作品,否则本网将保留按相关法律程序替原著作者追究侵权责任单位或个人的权利。\n\n(三)任何文章或图片的修改或删除均应保持作者原意并征求原作者同意,并注明授权范围。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有:未来网", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "1.任何单位和个人,凡在互联网或其他媒体转载、传播、使用解放军报社在所属媒体刊登的享有版权的作品,除法定许可使用外,必须事先获得解放军报社的书面授权,方可使用。\n\n2.任何单位或个人,在获得授权使用解放军报社作品时,必须注明解放军报社相应媒体平台来源、作者姓名和作品名称,并加注链接;不得擅自编造误导视听的作品名称,不得擅自作出违背作品原意的修改、篡改、摘录、改编等行为。\n\n3.除法定许可使用外,未经解放军报社授权许可,擅自对解放军报社享有版权的作品进行转载、传播、使用、修改、摘录、改编等行为,或不标注解放军报社所属媒体平台来源、作者姓名、作品名称等行为,以及著作权法规定的其他侵权行为,均属于侵犯解放军报社版权的行为。\n\n4.自声明之日起,由解放军报社全媒体运营广告部代表本报社唯一对外开展作品版权维权工作,凡已涉嫌侵权的单位和个人,须 及时与解放军报社全媒体运营广告部商谈版权谅解和合作事宜(咨询电话:010—66720652 邮箱:zzx@jfjb.com.cn)。\n\n5.侵权单位或个人 未立即删除侵权作品或未及时与解放军报社达成版权谅解和合作事宜的,解放军报社将对其依法进行公告或直接通过其他法律手段维权。\n\n6、解放军报社所属传统媒体、网络和新媒体包括:《解放军报》、《中国国防报》、《解放军画报》、《国防参考》、《环球军事》、《中国民兵》、《军事记者》、《国防教育》、长征出版社、长城出版社,中国军网(中英文版)、国防部网(中英文版)、解放军报网、国防动员网、军队人才网、解放军报客户端(互联网版)、解放军报客户端(军内版)及蓝信订阅号、军报法人微博(@军报记者)、军报记者微信公众账号、中国军网微信公众号等,军报记者网以及解放军报社各分社所属的军委后勤保障部网、军委装备发展部网、中国陆军网、中国海军网、中国空军网、中国武警网、东部战区网、南部战区网、西部战区网、北部战区网、中部战区网、西部战区陆军网和北部战区陆军网等子网。\n\n7、本声明由解放军报社负责全权解释。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有:中国民用航空局", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中华人民共和国财政部 版权所有,如需转载,请注明来源", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "该数据现已无法访问和获取" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本网站由黄河新闻网版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中共中央宣传部宣传舆情研究中心版权所有 未经书面授权禁止使用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中国精神文明网网站©版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data19.json b/sigs/datacompliance/merged_data19.json new file mode 100644 index 0000000000000000000000000000000000000000..4146f3c37f2b0170818180d5c89f8c248cc1a136 --- /dev/null +++ b/sigs/datacompliance/merged_data19.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data2.json b/sigs/datacompliance/merged_data2.json new file mode 100644 index 0000000000000000000000000000000000000000..33d3a8d08841391696f92a6481f72d0f133e811e --- /dev/null +++ b/sigs/datacompliance/merged_data2.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "4.知识产权\\n我们拥有伊秀的所有知识产权,包括但不限于商标、版权、专利等。未经我们的许可,您不得以任何形式使用我们的知识产权,包括但不限于复制、修改、传播等。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2015", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "5.3 懂球帝拥有本站内所有资料的版权。任何被授权的浏览、复制、打印和传播属于本站内的资料必须符合以下条件:\\n5.3.1 所有的资料和图象均以获得信息为目的;\\n5.3.2 所有的资料、图象及其任何部分都必须包括此版权声明;\\n5.3.3 本站所有的产品、技术与所有程序均属于懂球帝知识产权,在此并未授权。“懂球帝”及相关图形等为懂球帝的注册商标。\\n5.3.4 未经懂球帝许可,任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载)使用。否则,懂球帝将依法追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "四、知识产权\\n1、搜狐服务中包含的任何文字、图表、音频、视频或软件(包括但不限于软件中包含的图表、动画、音频、视频、界面实际、数据和程序、代码、文档)等信息或材料均受著作权法、商标法或其它法律法规的保护,未经相关权利人书面同意,用户不得以任何方式使用该等信息或材料,但出于使用搜狐服务目的而使用的除外。\\n\\n2、本协议未授予用户使用搜狐任何商标、服务标记、标识、域名和其他显著品牌特征的权利。\\n\\n3、除本协议明确允许的以外,用户不得以任何形式或任何方式对搜狐服务部分或全部内容进行修改、出租、租赁、出借、出售、分发、复制、创作衍生品或用于任何商业用途。\\n\\n4、用户在搜狐上发布的信息不得侵犯任何第三人的知识产权,未经相关权利人之事先书面同意,用户不得以任何方式上传、发布、修改、传播或复制任何受著作权保护的材料、商标或属于其他人的专有信息。\\n\\n5、用户同意,对于其上传到本网站的任何内容,搜狐在全世界范围内不限形式和载体地享有永久的、不可撤销的、免费的、非独家的使用权和转授权的权利,包括但不限于修改、复制、发行、展览、改编、汇编、出版、翻译、信息网络传播、广播、表演和再创作及著作权法等法律法规确定的其他权利,用户特别授权搜狐以自己名义单独对第三方的侵权行为提起诉讼并获得全额赔偿。搜狐无须为此向用户给予任何报酬或承担任何义务,也无须另行通知。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "三、版权条款\\n   为了保护知识产权,保障著作人和版权所有者的合法权益,保护凤凰网的合法权益,凤凰网声明:\\n(一)、凤凰网(www.ifeng.com)及其注册用户及本网站所有网页内的资料提供者拥有此网页内所有资料的版权。未经凤凰网的明确书面许可,任何人不得复制、转载、摘编、使用凤凰网所有网页内容,不得在非凤凰网所属的服务器上做镜像,不得对凤凰网的全部或部分页面、内容做商业链接。\\n(二)、任何团体与个人,拟在Internet上使用凤凰网的图、文、视/音频及其它信息资源,须事先与凤凰网联络并取得明确的书面许可。\\n(三)、凤凰网不保证为向用户提供便利而设置的外部链接的准确性和完整性。\\n(四)、凤凰网论坛(BBS)部分版权条款\\n1、严格遵守《中华人民共和国版权法》,任何转载或转贴都应注明真实作者和真实出处。\\n2、凤凰网有权在本网站范围内引用、发布、转载用户在凤凰网社区发布的内容。\\n3、凤凰网对于用户发布的内容所引发的版权、署名权的异议、纠纷不承担任何责任。\\n4、传统媒体转载须事先与原作者和凤凰网联系。\\n5、提交者发言纯属个人行为,只代表个人立场及观点,与本网站立场无关。\\n6、凤凰网有权认定和删除提交者所提交的任何不符合国家法律、法规和政策的任何言论、文字和图片。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "七、知识产权\\n\\n  1、央视网鼓励并支持分享作品、互相学习,为免争议,本协议所称“作品”包括【任何形式的作品(文字、图片、音乐、视频、表演等)、录音录像制品、代码、评论、帖子或用户在央视网发布的其他内容】。\\n\\n  2、央视网尊重知识产权并注重保护用户享有的各项权利,除另有约定外,您在央视网发布的所有原创作品,知识产权归您本人所有,您可自行授权第三方以任何方式使用而无须取得央视网的同意。您同意您在央视网发布的作品均免费授权央视网对作品进行公开传播、推广等方式的使用。\\n\\n  3、除了您自行创作、发布的作品外,央视网上所有其他内容包括但不限于产品、软件、音视频、图文资料、界面设计、版面框架、图标、数据等的所有权及知识产权归属于央视网所有。央视网在央视网中所使用的“央视国际”、“央视网”、“中国网络电视台”、“CNTV”、“CCTV.com”、“CNTV.cn”等商业标识,其著作权或商标权归央视网所有。所以,您只能在央视网授权下才能使用这些内容,未经央视网书面同意,您均不得以任何营利或非营利的目的擅自复制、发布、使用、改写上述内容,您也不得将上述内容授权给第三方实施、利用。\\n\\n  4、在不透露您的隐私资料前提下,央视网有权对整个用户数据库进行分析并对用户数据库进行商业上的利用。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "6、“直播吧”信息内容的使用规范\\n6.1 未经公司书面许可,你不得自行或授权、允许、协助任何第三人对本协议“直播吧”软件及相关服务中信息内容进行如下行为:\\n(1)复制、读取、采用“直播吧”软件及相关服务的信息内容,用于包括但不限于宣传、增加阅读量、浏览量等商业用途;\\n(2)擅自编辑、整理、编排“直播吧”软件及相关服务的信息内容后在“直播吧”软件及相关服务的源页面以外的渠道进行展示;\\n(3)采用包括但不限于特殊标识、特殊代码等任何形式的识别方法,自行或协助第三人对“直播吧”软件及相关服务的信息内容产生流量、阅读量引导、转移、劫持等不利影响;\\n(4)其他非法获取或使用“直播吧”软件及相关服务的信息内容的行为。\\n6.2 经公司书面许可后,你对“直播吧”软件及相关服务的信息内容的分享、转发等行为,还应符合以下规范:\\n(1)对抓取、统计、获得的相关搜索热词、命中率、分类、搜索量、点击率、阅读量等相关数据,未经公司事先书面同意,不得将上述数据以任何方式公示、提供、泄露给任何第三人;\\n(2)不得对“直播吧”软件及相关服务的源网页进行任何形式的任何改动,包括但不限于“直播吧”软件及相关服务的首页(profile页面)链接,广告系统链接等入口,也不得对“直播吧”软件及相关服务的源页面的展示进行任何形式的遮挡、插入、弹窗等妨碍;\\n(3)应当采取安全、有效、严密的措施,防止“直播吧”软件及相关服务的信息内容被第三方通过包括但不限于“蜘蛛(spider)”程序等任何形式进行非法获取;\\n(4)不得把相关数据内容用于公司书面许可范围之外的目的,进行任何形式的销售和商业使用,或向第三方泄露、提供或允许第三方为任何方式的使用;\\n(5)向任何第三人分享、转发、复制“直播吧”软件及相关服务信息内容的行为,应当遵守公司为此制定的其他规范和标准。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2014 - 2023 read.douban.com, all rights reserved. 北京方舟阅读科技有限公司", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright ©2021-2025 jiandalou.net 健康无忧网 版权所有. 转载请标明出处", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "5、本网站内凡注明“来源:放心医苑网”或“来源:有问必答网”的所有文字、图片和音视频稿件均属本网站原创内容,版权均属珠海健康云科技有限公司所有,任何媒体、网站或个人未经本网站授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站,在下载使用时必须注明“稿件来源:放心医苑网”或者“来源:有问必答网”,违者本网站将依法追究责任。8、用户从网站提供的服务中获得的信息在没有得到事先许可的情况下,个人或提供给第三方利用复制,发送,传播等手段用于盈利目的时,将追究相关当事人的法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2011120健康网", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "我们的专有权利\\n除您的用户内容外,任何用户贡献的文章文本,或本协议明确规定,本服务及其中或由此传输的所有材料,包括但不限于软件、图像、图形、插图、文本、徽标、专利、商标、服务标志、版权、照片、音频、视频、音乐和属于其他用户的用户内容(“wikihow内容”),以及与之相关的所有知识产权, 是wikiHow及其许可方(包括向服务发布用户内容的其他用户)的专有财产。除本协议明确规定外,本协议中的任何内容均不得被视为在任何此类知识产权中或根据任何此类知识产权创建许可,并且您同意不出售、许可、出租、修改、分发、复制、复制、传输、公开展示、公开表演、出版、改编、编辑或从任何wikiHow内容创建衍生作品。严禁将wikiHow内容用于本协议未明确允许的任何目的。\\n\\n\\n您可以选择或我们邀请您提交有关服务的评论或想法,包括但不限于关于如何改进服务或我们的产品(“想法”)。通过提交任何想法,您同意您的披露是无偿的、未经请求的、不受限制的,并且不会使wikiHow承担任何信托或其他义务,并且我们可以自由使用该想法而无需向您支付任何额外补偿,和/或以非保密方式或以其他方式向任何人披露该想法。您进一步承认,通过接受您的提交,wikiHow不放弃使用wikiHow以前已知的,或由其员工开发的,或从您以外的来源获得的类似或相关想法的任何权利。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "27.9 爱彼迎平台内容。通过爱彼迎平台提供的内容受版权、商标和/或美国及其他国家/地区的其他法律保护。您承认该内容的所有知识产权均为爱彼迎和/或其许可方的专有财产,并同意您不会删除、更改或遮挡任何版权、商标、服务标识或其他所有权声明。您不得使用、复制、改编、修改、创制衍生作品、传播、许可、出售、转让、公开展示、公开表演、传输、广播或以其他方式利用通过爱彼迎平台访问的任何内容,除非您是该内容的合法所有者,或本《服务条款》明确准许。在遵守本《服务条款》的前提下,爱彼迎授予您有限、非排他、不得再许可、可撤销、不可转让的许可,准许您:(i) 在您的个人设备上下载和使用应用程序;及 (ii) 访问和浏览爱彼迎平台上或通过爱彼迎平台您可访问的任何内容,但仅供您个人使用,不得用于商业目的。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "七、知识产权\\n7.1途牛所有的商品、技术、程序、页面(包括但不限于页面设计及内容)以及资料内容(包括但不限于本站所刊载的图片、 视频、Flash等)均属于知识产权,仅供用户交流、学习、研究和欣赏,未经授权,任何人不得擅自使用、转载和编辑,否则,将依法追究法律责任。\\n\\n7.2用户在攻略及论坛频道上传的用户平台信息,应保证为原创或已得到充分合法授权(包括但不限于著作权、所涉人物肖像权),并具有准确性、真实 性、正当性、合法性,且不含任何侵犯权利人合法权益的内容。如因用户抄袭、转载、未合法授权等等未经权利人同意的侵权行为导致权利人通知途牛的,则途牛通 过系统联系或者联系号码及时通知用户后,用户应在收到通知的3日内给予途牛相关合法使用声明,否则途牛有权单方删除相关侵权信息,且由此所产生的纠纷、损 失和费用由用户自行解决和承担,途牛不承担任何法律责任。\\n\\n7.3用户同意途牛免费在其网络不同页面上呈现用户上传的资料内容,作为正面宣传、展示。途牛不得作为负面宣传、展示或者对用户形象有诋毁或者贬低。\\n\\n7.4“途牛旅游网”、牛头(图形)及“tuniu.com”组合为南京途牛科技有限公司注册商标,用户未经途牛书面授权或者许可,不得擅自使用,否则,途牛将依法追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "七、知识产权声明\\n本网站(www.tuniu.com)所有的产品、技术、程序、页面(包括但不限于页面设计及内容)以及资料内容(包括但不限于本站所刊载的图片、视频、Flash等)均属于知识产权,仅供本用户交流、学习、研究和欣赏,未经授权,任何人不得擅自使用,否则,将依法追究法律责任。\\n\\n本网站用户在攻略及论坛频道上传的资料内容(包括但不限于图片、视频、Flash、点评等),应保证为原创或已得到充分授权,并具有准确性、真实性、正当性、合法性,且不含任何侵犯第三人权益的内容,因抄袭、转载、侵权等行为所产生的纠纷由用户自行解决,本网站不承担任何法律责任。\\n\\n“途牛旅游网”、牛头(图形)及“tuniu.com”组合为南京途牛科技有限公司注册商标,任何人不得擅自使用,否则,将依法追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "二 知识产权声明\\n2.1易车提供的网络服务中所包含的任何文字、软件、图片、图形、图表、网页、音频、视频、域名等相关内容均受中国版权、商标及/或其他财产所有权等法律、法规及/或国际公约的保护,对为提供网络服务而使用的任何软件的一切权利均属于该软件的著作权人,未经易车或相关权利人同意,任何人均不得在任何媒体、任何场合直接或间接发布、使用、修改和再使用;易车不对由上述资料产生或在传送、递交全部或部分上述资料,使用相关软件过程中产生的延误、不准确、错误和遗漏或由此产生的任何损害进行赔偿,亦无需以任何形式向用户或任何第三方负责。同时,经易车书面同意进行转载的,转载人应标明相关内容出处及原作者相关信息。\\n\\n2.2易车对用户在使用易车网络服务(包括但不限于口碑、论坛、BBS、)中发布的信息、资讯、文字、图片、图形、图表、音频、视频、软件等(以下简称“内容”)无偿拥有非独家使用权和完全再许可的权利(该等权利不受任何时间和空间的限制),使用范围包括但不限于网站、杂志、期刊、电视、广播等领域。\\n\\n2.3用户在易车网络服务中所发布的内容仅代表用户个人的观点和立场,易车不对此承担任何法律责任及其他责任。\\n\\n2.4易车、易车网及图、车易通、Bitauto及图、等为易车旗下公司拥有的注册商标或商标,均受法律保护。未经易车旗下公司事先书面许可,任何单位及个人不得以任何方式对该等商标的任何部分进行使用、复制、修改、传播、抄录或与其它产品捆绑使用销售。对任何侵犯该等商标权的行为,易车旗下公司保留依法追究其法律责任的权利。\\n\\n2.5鉴于互联网具有海量信息的特点,易车不排除旗下网站(不含互动服务)有极少数作品因客观原因无法联系到权利人。易车将该部分作品的著作权使用费交给相关著作权报酬收转单位代为收转。在此,请相关权利人与易车或者相关报酬收转单位联系,以获得相关报酬。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "10、知识产权\\n\\n10.1 公司在“懂车帝”及相关服务中提供的内容(包括但不限于软件、技术、程序、网页、文字、图片、图像、音频、视频、图表、版面设计、电子文档等)的知识产权属于公司或相关权利人所有。公司提供本服务时所依托的软件的著作权、专利权及其他知识产权均归公司所有。未经公司许可,任何人不得擅自使用(包括但不限于通过任何机器人、蜘蛛等程序或设备监视、复制、传播、展示、镜像、上载、下载)“懂车帝”及相关服务中的内容。\\n\\n10.2 你理解并同意,在使用“懂车帝”及相关服务时发布上传的文字、图片、视频、音频等均由你原创或已获合法授权。你通过“懂车帝”上传、发布的任何内容的知识产权归属你或原始著作权人所有。\\n\\n10.3 你知悉、理解并同意,为持续改善并为你提供更好的服务,你通过“懂车帝”及相关服务发布、传输或传播的内容(包括但不限于文字、图片、图像、音频、视频和/或音频中的音乐、声音、对话等),授权公司及其关联公司控制公司、继承公司一项全球范围内、免费、非独家、可再许可(通过多层次)的权利(包括但不限于复制权、信息网络传播权、改编权、汇编权、修改权、翻译权、制作衍生品、表演和展示等权利),使用范围包括但不限于在当前或其他网站、应用程序、产品或终端设备等。你在此确认并同意,上述权利的授予包括在内容、“懂车帝”、公司和/或公司品牌有关的任何的宣传、推广、广告和/或相关营销中使用和以其他方式开发内容(全部或部分)的权利和许可。为避免疑惑,你同意,上述权利的授权包括许可使用、复制、展示、传播你拥有或被许可使用并植入内容中的个人形象、肖像、姓名、商标、服务标志、品牌、名称、标识、公司标记及其他物料、素材等。\\n\\n10.4 你确认并同意授权公司以公司自己的名义或委托专业第三方对侵犯你上传发布的享有知识产权的内容进行代维权,维权形式包括但不限于:监测侵权行为、发送维权函、提起诉讼或仲裁、调解、和解等,公司有权对维权事宜做出决策并独立实施。\\n\\n10.5 公司为“懂车帝”开发、运营提供技术支持,并对“懂车帝”及相关服务的开发和运营等过程中产生的所有数据和信息等享有法律法规允许范围内的全部权利。\\n\\n10.6 请你在任何情况下都不要私自使用公司的包括但不限于“懂车帝”等在内的任何商标、服务标记、商号、域名、网站名称或其他显著品牌特征等(以下统称为“标识”)。未经公司事先书面同意,你不得将本条款前述标识以单独或结合任何方式展示、使用或申请注册商标、进行域名注册等,也不得实施向他人明示或暗示有权展示、使用、或其他有权处理该些标识的行为。由于你违反本协议使用公司上述商标、标识等给公司或他人造成损失的,由你承担全部法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "1.用户在车云上发表的全部评论,著作权均归用户本人所有。用户可授权第三方以任何方式使用,不需要得到车云的同意。\\n\\n2.车云可改写用户投稿内容进行发表,包括但不限于问题及补充说明、答案总结、话题描述、话题结构等。\\n\\n3.车云提供的网络服务中包含的标识、版面设计、排版方式、文本、图片、图形等均受著作权、商标及其它法律保护,未经相关权利人(含车云及其他原始权利人)同意,上述内容均不得在任何平台被直接或间接发布、使用、出于发布或使用目的的改写或再发行,或被用于其他任何商业目的。\\n\\n4.为了促进知识的分享和传播,用户将其在车云上发表的全部内容,授予车云免费的、不可撤销的、非独家使用许可,车云有权将该内容用于车云各种形态的产品和服务上,包括但不限于网站以及发表的应用或其他互联网产品。\\n\\n5.第三方若出于非商业目的,将用户在车云上发表的内容转载在车云之外的地方,应当在作品的正文开头的显著位置注明原作者姓名(或原作者在车云上使用的账号名称),给出原始链接,注明「发表于车云」,并不得对作品进行修改演绎。若需要对作品进行修改,或用于商业目的,第三方应当联系用户获得单独授权,按照用户规定的方式使用该内容。\\n\\n6.在车云上传或发表的内容,用户应保证其为著作权人或已取得合法授权,并且该内容不会侵犯任何第三方的合法权益。如果第三方提出关于著作权的异议,车云有权根据实际情况删除相关的内容,有权追究用户的法律责任,给车云或任何第三方造成损失的,用户应负责全额赔偿。\\n\\n7.如果任何第三方侵犯了车云用户相关的权利,用户同意授权车云或其指定的代理人代表车云自身或用户对该第三方提出警告、投诉、发起行政执法、诉讼、进行上诉,或谈判和解,并且用户同意在车云认为必要的情况下参与共同维权。\\n\\n8.车云有权但无义务对用户发布的内容进行审核,有权根据相关证据结合《侵权责任法》、《信息网络传播权保护条例》等法律法规及车云社区指导原则对侵权信息进行处理。\\n\\n9.车云、车云网及相关图标为公司拥有的注册商标或商标,均受法律保护。未经车云公司事先书面许可,任何单位及个人不得以任何方式对该等商标的任何部分进行使用、+G39复制、修改、传播、抄录或与其它产品捆绑使用销售。对任何侵犯该等商标权的行为,车云公司保留依法追究其法律责任的权利。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data20.json b/sigs/datacompliance/merged_data20.json new file mode 100644 index 0000000000000000000000000000000000000000..292656d2cd9fc4ce383bcfd74a48a642e30e2630 --- /dev/null +++ b/sigs/datacompliance/merged_data20.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "共产党员网 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "凡本网注明“来源:中华网”的所有作品,均为北京华网智讯信息有限公司合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:中华网”。违反上述声明者,本网将追究其相关法律责任。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data21.json b/sigs/datacompliance/merged_data21.json new file mode 100644 index 0000000000000000000000000000000000000000..f834f0861018a9bd5e12220f31a281cff7b27946 --- /dev/null +++ b/sigs/datacompliance/merged_data21.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "共产党员网 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "该数据现已无法访问和获取" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "该数据现已无法访问和获取" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright (C) 2001-2023 dzwww.com. All Rights Reserved", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "  2、光明网网页所呈现的任何资料(包括但不限于文字、图片、声音、视频、版面设计及其他任何形式的作品)的版权均属光明网和相关权利人所有。未经光明网及相关权利人书面许可,任何人不得引用、复制、转载、摘编或以其他任何方式使用光明网的上述内容。\n\n  3、凡来源为“光明网”或单独带有光明网水印LOGO的所有文字、图片、音频、视频及其他任何形式的作品,其版权均属于光明网,任何媒体、单位或个人未经本网书面授权不得以任何形式转载、摘编、改编或以其他方式复制发表。经本网授权的媒体、单位或个人,应在授权范围内使用,并注明来源“光明网”。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "海外网传媒有限公司版权所有,未经书面授权禁止使用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有:未来网", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "法制网传媒(北京)有限公司版权所有,未经协议授权禁止转载", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中华人民共和国外交部 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "凡本网注明 “来源:XXX(非国防部网站)” 的作品,均由其他媒体及相关单位提供。任何媒体或互联网站如需转载,必须与相应提供单位直接联系获得合法授权。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有:中华人民共和国国家民族事务委员会", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "凡本网注明“来源:新华网”的所有作品,均为新华网股份有限公司合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:新华网”。违反上述声明者,本网将追究其相关法律责任。\n\n凡本网注明“来源:XXX(非新华网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。\n\n对于新华社下属社办报刊通过本网发布的作品,本网受著作权人委托,在此声明禁止任何媒体、网站或个人在未经书面授权的情况下违法转载或使用。\n\n如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中央和国家机关工委旗帜杂志社版权所有 人民网 中国共产党新闻网承建 版权声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经许可 不得转载、复制", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data22.json b/sigs/datacompliance/merged_data22.json new file mode 100644 index 0000000000000000000000000000000000000000..effad8c275d6991a8442693f905bcd3218cbdb63 --- /dev/null +++ b/sigs/datacompliance/merged_data22.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "任何媒体、网站或个人未经本网书面授权不得转载、链接、转贴或以其他方式使用;已经本网书面授权的,在使用时必须注明“来源:国务院新闻办公室网站”。违反上述声明者,本网将追究其相关法律责任。\n\n  二、凡本网注明“来源:XXX(非国务院新闻办公室和地方各级政府新闻办公室)”的作品,转载的内容均有可靠的来源,明确署有出处,其版权属于原作者。转载目的在于传递更多信息,并不代表国务院新闻办公室和本网站赞同其观点和对其真实性负责。由于受条件限制,如有未能与作者本人取得联系,或作者不同意该内容在本网公布,或发现有错误之处,请与本网联系,我们将尊重作者的意愿,及时予以更正。如其他媒体、网站或个人转载使用,必须保留本网注明的“稿件来源”,并自负法律责任。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经中工网书面许可,任何人不得引用、复制、转载、摘编或以其他任何方式非法使用中工网的上述内容。对于有上述行为者,中工网将保留追究其法律责任的权利。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright© 1999-2020 消费日报社 版权所有 违者必究", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": " 本网站信息内容由西藏自治区人民政府、及其门户网站以及自治区相关部门单位提供。任何媒体、互联网站和商业机构不得利用本网站发布的内容进行商业性的原版原式地转载,也不得歪曲和篡改本网站所发布的内容。本网站所涉及到的版权归本网站所属。\n\n  任何媒体或互联网站不得擅自转载本网站由其他单位提供的信息和服务内容,如需转载,必须与相应提供单位直接联系获得合法授权。\n\n 本网站提供的资料如与相关纸质文本不符,以纸质文本为准。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": " 本网站信息内容由西藏自治区人民政府、及其门户网站以及自治区相关部门单位提供。任何媒体、互联网站和商业机构不得利用本网站发布的内容进行商业性的原版原式地转载,也不得歪曲和篡改本网站所发布的内容。本网站所涉及到的版权归本网站所属。\n\n  任何媒体或互联网站不得擅自转载本网站由其他单位提供的信息和服务内容,如需转载,必须与相应提供单位直接联系获得合法授权。\n\n 本网站提供的资料如与相关纸质文本不符,以纸质文本为准。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经中国青年报社书面授权,任何机构或个人无权转载、剪辑、修改、摘编、转贴或以其他方式复制并传播,包括但不限于文字、图片、声音、录像、图表、标志、标识、版面设计以及为读者提供的任何信息。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本网站内容由自然资源部地图技术审查中心提供。任何媒体、互联网站和商业机构不得利用本网站发布的内容进行商业性的原版原式地转载,也不得歪曲和篡改本网站所发布的内容。本网站所涉及到的版权归本网站所属。\n\n本网站提供的资料如与相关纸质文本不符,以纸质文本为准。\n\n任何媒体或互联网站不得擅自转载本网站由其他单位提供的信息和服务内容,如需转载,必须与相应提供单位直接联系获得合法授权。\n\n自然资源部地图技术审查中心拥有本网站内所有资料的版权,对违反版权者保留一切追索权利。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "许可证", + "output": "不确定" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 © 2004-2023 美食天下 保留所有权利", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2004-2022 美食天下 保留所有权利 - 京ICP证090244号 / 京ICP备10020153号", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "该数据现已无法访问和获取" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "5、任何单位或个人如认为通过搜狗网站搜索引擎服务所得的第三方网页中内容可能涉嫌侵害其合法著作权,应按照《信息网络传播权保护条例》的规定,以书面的形式及时向搜狗公司反应,并提供相应身份证明、权属证明及详细的侵权情况证明,搜狗公司在收到上述文件后,会尽快断开搜索结果中至被控侵权的第三方网页的链接。如果该等被断开链接的第三方网站所有者认为被提出权利主张的搜狗搜索结果并未侵害他人合法著作权的,亦有权按照《信息网络传播权保护条例》的规定,向搜狗公司发出关于被断开链接不违反《信息网络传播权保护条例》的反通知。搜狗公司提醒您注意:如您的主张侵权或主张不侵权的陈述失实,您将按照《信息网络传播权保护条例》的规定,承担相关法律责任。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2023 Sohu All Rights Reserved. 搜狐公司 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "球天下的服务内容包括:文字、软件、声音、图片、录象、图表;广告中的全部内容;电子邮件的全部内容;球天下为用户提供的其他信息。所有这些内容受版权、商标、标签和其它财产所有权法律的保护。所以,用户只能在球天下体育授权下才能使用这些内容,而不能擅自复制、再造这些内容、或创造与内容有关的派生产品。球天下所有的文章版权归原文作者和球天下共同所有,任何人需要转载球天下的文章,必须征得原文作者或球天下授权。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "宠物圈", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data23.json b/sigs/datacompliance/merged_data23.json new file mode 100644 index 0000000000000000000000000000000000000000..048a46bc426dfece820c7d15f95c4ed93431fc4f --- /dev/null +++ b/sigs/datacompliance/merged_data23.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "7.3除法律规定外,未经「蘑菇宠医」书面形式的明确许可,任何单位或个人不得以任何方式全部或部分复制、转载、引用、链接、抓取或以其他方式使用「蘑菇宠医」的信息内容(包括但不限于:源程序和文档、用户界面设计、文案等)。如有违反本条协议者,一经调查及核实,「蘑菇宠医」坚决追究其法律责任,并要求其赔偿因其行为所造成的任何经济损失。\n\n7.4用户在此同意并承诺,在「蘑菇宠医」平台上的发布的内容不构成对他人知识产权、隐私权或其他权利的侵犯。因用户违反上述承诺,所造成或引起的任何形式的法律纠纷,由用户个人承担法律责任。\n\n7.5本用户协议已经构成《中华人民共和国著作权法》及相关法律规定的著作权财产性权利(包括但不限于:复制权、发行权、出租权、展览权、表演权、广播权、信息网络传播权、改编权、摄制权、翻译权、汇编权等)的转让书面协议,其效力及于用户在「蘑菇宠医」上发布的任何受著作权法保护的作品内容。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2000-2023www.ChinaXinge.com All Rights Reserved", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": " 除非中国法律另有规定,未经中国教育在线书面许可,对于中国教育在线拥有版权或其他知识产权的任何内容,任何人不得复制或在非中国教育在线所属的服务器上做镜像或以其他任何方式进行使用。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本站一贯高度重视知识产权保护并遵守中华人民共和国各项知识产权法律、法规和具有约束力的规范性文件。本站认为著作权拥有者的合法权益应该得到尊重和依法保护,坚决反对任何违反中华人民共和国有关著作权的法律法规的行为。\n\n由于本站无法对用户上传到本网站的所有作品内容进行充分的监测,如果阁下是某一作品的著作权人或依法可以行使信息网络传播权的权利人,且阁下认为本站上用户上传内容侵犯了阁下对该作品的信息网络传播权,请阁下发邮件通知本站(本站邮箱:czd0126@163.com),本站将根据相关法律规定采取措施删除相关内容。阁下应对通知陈述之真实性负责。为方便本站及时处理阁下之意见,阁下的通知书中应至少包含以下内容:\n\n 1、阁下的名称(姓名)及身份证明电子版(包括身份证、法人执照、营业执照等有效身份证件)、联系方式(含Email地址)及地址;\n\n 2、要求删除的作品的名称和在本网站的地址;\n\n 3、构成侵权的初步证明材料,谨此提示以下材料可能构成初步证明:对于涉嫌侵权作品阁下拥有著作权或依法可以行使信息网络传播权的权属证明;对涉嫌侵权作品侵权事实的举证证明。(如阁下所拥有的著作权权属证明,包括但不限于有关的著作权登记证书或创作原稿等)。\n\n在本站上传作品的会员视为同意本站上述及已采用的相应措施。本站不因此而承担任何违约责任或其他任何法律责任,包括不承担因侵权指控不成立而给原上传用户带来损害的赔偿责任。本站在收到上述通知后会发送电子邮件通知上载该作品的会员。对于多次上载涉嫌侵权作品的会员,本站将取消其会员资格。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "除非天眼查另行声明,天眼查平台内的本网站(www.tianyancha.com)的所有产品、技术、软件、程序、 数据及其他信息(包括但不限于文字、图像、图片、照片、音频、视频、图表、色彩、版面设计、电子文档)的所有权利所有知识产权(包括但不限于版权、商标权、 专利权、商业秘密及其他所有相关权利)均归天眼查或其关联公司所有。未经天眼查许可,任何人不得擅自使用(包括但不限于通过任何机器人、 蜘蛛等程序或设备监视、复制、传播、展示、镜像、上载、下载)天眼查平台内的任何内容。\n\n天眼查平台的Logo、“天眼查”、“tianyancha”等文字、图形及其组合,以及天眼查平台的其他标识、 徽记、产品和服务名称均为天眼查及其关联公司在中国和其它国家的商标,未经天眼查书面授权,任何人不得以任何方式展示、 使用或作其他处理,也不得向他人表明您有权展示、使用或作其他处理。\n\n天眼查尊重知识产权,反对侵权盗版行为。未经天眼查许可, 任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载)使用,或通过非常规方式(如:恶意干预天眼查数据)影响天眼查的正常服务, 任何人不得擅自以软件程序自动获得天眼查数据。否则,天眼查有权依法追究其法律责任。\n\n未经天眼查许可,任何人禁止转载或商业使用天眼查网站内文字、图形、表格等信息,否则, 天眼查保留采取一切合法方式维护正当利益的权利。经许可的信息的转载或商业使用时,应当以恰当方式说明,该信息来源于天眼查。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 中国科学院植物研究所", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "许可证", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© copyright 2010-2022 值得买科技. All rights reserved. 版权所有 本站内容未经书面许可,禁止一切形式的转载。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "该数据现已无法访问和获取" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2006-2023ruiwen.com版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2019-2022 好生活,好二三四 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2019-2022 好生活,好二三四 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 星座网 www.xingzuo.com 法律声明:如有侵权,请告知网站管理员我们会在7个工作日内处理。本站除标明 \"本站原创\" 外所有照片版权归创作人所有,如有冒犯, 请直接联系本站, 我们将立即予以纠正并致歉!", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data24.json b/sigs/datacompliance/merged_data24.json new file mode 100644 index 0000000000000000000000000000000000000000..8a7927fdc7487f1d2c0e9c8444bbce1f94947554 --- /dev/null +++ b/sigs/datacompliance/merged_data24.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 11467.com 顺企网版权所有 发布批发采购信息、查询企业黄页,上顺企网", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有:上海玄霆娱乐信息科技有限公司", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "铁血社区 Ver2.3 铁血网版权所有2001-2018", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "许可证", + "output": "不确定" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "电视猫网站的原创剧情系电视猫网站独立创作,并受知识产权等相关法律保护。任何单位或个人,未经本网站主办方的许可, 不得以任何方式(包括但不限于:复制、篡改、盗链、程序盗取等)直接或间接地使用剧情。\n\n否则,本网站主办方将保留进一步追究侵权者法律责任的权利。\n\n转载许可:\n\n1. 在贵方网站首页挂链接,链接地址: http://www.tvmao.com ,链接文字:剧情介绍\n\n2. 在转载页面加来源出处链接,链接地址,被转载剧情的页面地址 如:http://www.tvmao.com/drama/L2gvKSE=/episode ,链接文字:老九门分集剧情来源电视猫\n\n3. 以上链接不得加 nofollow\n\n接受以上3条,并请联系 tvmaobd@163.com 确认转载。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "电影网立足于互联网为客户提供全方位的服务。电影网的各项服务的所有权和运营权归电影卫星频道节目制作中心版权所有。电影网的点播影片版权归电影卫星频道节目制作中心版权所有。\n\n  电影网提供的服务将完全按照其发布的章程、服务条款和操作规则严格执行。用户若完全同意所有服务条款,完成相关注册程序后即可成为电影网的用户,用户在享受电影网任何单项服务时,应当受本服务条款的约束。\n\n  电影网由电影卫星频道节目制作中心运营和控制,符合中华人民共和国法律。保留随时更改网站上述免责条款的权利。 (c) 2005-2009,电影网。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "11.1腾讯在本服务中提供的内容(包括但不限于网页、文字、图片、音频、视频、图表、计算机软件等)的知识产权归腾讯所有,用户在使用本服务中所产生内容的知识产权归用户或相关权利人所有,除非您与腾讯另有约定。\n\n 11.2除另有特别声明外,腾讯提供本服务时所依托软件的著作权、专利权及其他知识产权均归腾讯所有。\n\n 11.3腾讯在本服务中所使用的“QQ”、“腾讯”、“TENCENT”及企鹅形象等商业标识,其著作权或商标权归腾讯所有。\n\n 11.4上述及其他任何本服务包含的内容的知识产权均受到法律法规保护,未经腾讯、用户或相关权利人书面许可,任何人不得以任何形式进行使用或创造相关衍生作品。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "9.1 公司在“今日头条”软件及相关服务中提供的内容(包括但不限于软件、技术、程序、网页、文字、图片、图像、音频、视频、图表、版面设计、电子文档等)的知识产权属于公司所有。公司提供“今日头条”服务时所依托的软件的著作权、专利权及其他知识产权均归公司所有。未经公司许可,任何人不得擅自使用(包括但不限于通过任何机器人、“蜘蛛”等程序或设备监视、复制、传播、展示、镜像、上载、下载)“今日头条”软件及相关服务中的内容。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "澎湃新闻网提供的所有网页内容、网页设计的所有内容(包括但不限于文字、图片、声音、录像、图表、标志、标识、广告、商标、商号、域名、软件、程序、版面设计、专栏目录与名称、内容分类标准及多媒体形式的新闻﹑信息等),均受我国相关法律及适用之国际公约中有关著作权、商标权、专利权及/或其他财产所有权法律的保护,为澎湃新闻网及/或相关权利人专属所有或持有。\n\n未经澎湃新闻网及/或相关权利人明确书面授权,任何人不得复制、转载、摘编、修改、链接、转帖澎湃新闻网的内容,或在非澎湃新闻网所属的服务器上做镜像或以其他任何方式进行使用。\n\n获得合法授权的,应在授权范围内使用,必须为作者署名并注明“来源:澎湃新闻网”字样,并按有关国际公约和中华人民共和国法律的有关规定向相关权利人支付版权费用。该版权费用为800-1000元/千字,500-800元/图片(具体费用另行协商确定)。违反上述声明者,本网将依法追究其相关法律责任。\n\n对于本站所有形式的原创内容,本站有结集出版的权利。\n\n澎湃新闻网对于用户所发布的内容所引发的版权、署名权疑议、纠纷,不承担任何责任。\n\n澎湃新闻网所转载、链接的内容,出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本网所有内容,凡注明“来源:胶东在线网”或有标识的所有文字、图片和音视频资料,版权均属胶东在线网站所有,任何媒体、网站或个人未经本网授权不得转载、链接、转贴或以其他方式复制、发布。已经本网授权的媒体、网站,在下载使用时必须注明“稿件来源:胶东在线网”并保留原有标识,违者本网将依法追究法律责任。\n2、本网以下内容不可任意转载:\n (1)本网所指向的非本网内容的相关链接内容;\n (2)已作出不得转载或未经许可不得转载声明的内容;\n (3)未由本网署名或本网引用、转载的他人作品等非本网版权内容;\n (4)本网中特有的图形、标志、页面风格、编排方式、程序等;\n (5)本网中必须具有特别授权或具有注册用户资格方可知晓的内容;\n (6)其他法律法规不允许或本网认为不适合转载的内容。\n3、转载或引用本网内容,不得进行如下活动:\n (1)任何违法行为;\n (2)损害本网或他人利益的行为;\n (3)任何可能破坏公序良俗的行为;\n (4)擅自同意他人继续转载、引用本网内容;\n (5)不得用于商业活动或商业炒作。\n4、转载或引用本网版权所有之内容须注明“转自(或引自)胶东在线”字样,标明本网网址www.jiaodong.net,并不得删除或破坏本网原有技术措施或标识,不得任意删改或歪曲转自本网具有版权的内容。\n5、凡本网注明“来源:XXX(非胶东在线)”的作品,均系胶东在线转载自其它媒体,转载目的在于向公众传递更多信息,并不代表本网赞同其作品所持观点和对其真实性负责。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "用户在证券时报网发表的内容(包含但不限于证券时报网目前各产品功能里的内容)仅表明其个人的立场和观点,并不代表证券时报网的立场或观点。作为内容的发表者,需自行对所发表内容负责,因所发表内容引发的一切纠纷,由该内容的发表者承担全部法律及连带责任。证券时报网不承担任何法律及连带责任。用户在证券时报网发布侵犯他人知识产权或其他合法权益的内容,证券时报网有权予以删除,证券时报网不承担任何法律及连带责任,并保留移交司法机关处理的权利。用户在使用证券时报网网络服务过程中,必须遵循以下原则:(1)遵守中国有关的法律和法规;(2)不得为任何非法目的而使用网络服务系统;(3)遵守所有与网络服务有关的网络协议、规定和程序;(4)不得利用证券时报网网络服务系统进行任何可能对互联网的正常运转造成不利影响的行为;(5)不得利用证券时报网网络服务系统传输任何骚扰性的、中伤他人的、辱骂性的、恐吓性的、庸俗淫秽的或其他任何非法的信息资料;(6)不得利用证券时报网网络服务系统进行任何不利于证券时报网的行为;(7)如发现任何非法使用用户帐号或帐号出现安全漏洞的情况,应立即通告证券时报网。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "新浪公司独立拥有或与相关内容提供者共同拥有新浪网站内相关内容(包括但不限于文字、图片、音频、视频资料及页面设计、编排、软件等)的版权和/或其他相关知识产权。“新浪网”、“sina”为新浪公司及其关联公司的注册商标,受中国法律保护。\n\n\n除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\n\n\n违反上述声明而给新浪公司造成损失的,新浪公司将依法追究其法律责任。\t", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "网易公司提供的内容包括但不限于:非用户上传/提供的文字、软件、图片、音频、视频、图表、程序代码、界面设计、版面框架、数据资料、账号等,所有这些内容的知识产权及相关智力成果的权利均属于网易公司,并受版权、商标、专利和其它相关法律的保护。未经网易公司授权,用户不得使用上述内容,并且用户未经许可,不得对上述内容进行包括但不限于复制、销售、重制、再创作等行为。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "11.1腾讯在本服务中提供的内容(包括但不限于网页、文字、图片、音频、视频、图表、计算机软件等)的知识产权归腾讯所有,用户在使用本服务中所产生内容的知识产权归用户或相关权利人所有,除非您与腾讯另有约定。\n\n 11.2除另有特别声明外,腾讯提供本服务时所依托软件的著作权、专利权及其他知识产权均归腾讯所有。\n\n 11.3腾讯在本服务中所使用的“QQ”、“腾讯”、“TENCENT”及企鹅形象等商业标识,其著作权或商标权归腾讯所有。\n\n 11.4上述及其他任何本服务包含的内容的知识产权均受到法律法规保护,未经腾讯、用户或相关权利人书面许可,任何人不得以任何形式进行使用或创造相关衍生作品。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "澎湃新闻网提供的所有网页内容、网页设计的所有内容(包括但不限于文字、图片、声音、录像、图表、标志、标识、广告、商标、商号、域名、软件、程序、版面设计、专栏目录与名称、内容分类标准及多媒体形式的新闻﹑信息等),均受我国相关法律及适用之国际公约中有关著作权、商标权、专利权及/或其他财产所有权法律的保护,为澎湃新闻网及/或相关权利人专属所有或持有。\n\n未经澎湃新闻网及/或相关权利人明确书面授权,任何人不得复制、转载、摘编、修改、链接、转帖澎湃新闻网的内容,或在非澎湃新闻网所属的服务器上做镜像或以其他任何方式进行使用。\n\n获得合法授权的,应在授权范围内使用,必须为作者署名并注明“来源:澎湃新闻网”字样,并按有关国际公约和中华人民共和国法律的有关规定向相关权利人支付版权费用。该版权费用为800-1000元/千字,500-800元/图片(具体费用另行协商确定)。违反上述声明者,本网将依法追究其相关法律责任。\n\n对于本站所有形式的原创内容,本站有结集出版的权利。\n\n澎湃新闻网对于用户所发布的内容所引发的版权、署名权疑议、纠纷,不承担任何责任。\n\n澎湃新闻网所转载、链接的内容,出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "\n新浪公司独立拥有或与相关内容提供者共同拥有新浪网站内相关内容(包括但不限于文字、图片、音频、视频资料及页面设计、编排、软件等)的版权和/或其他相关知识产权。“新浪网”、“sina”为新浪公司及其关联公司的注册商标,受中国法律保护。\n\n\n除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\n\n\n违反上述声明而给新浪公司造成损失的,新浪公司将依法追究其法律责任。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "新浪公司独立拥有或与相关内容提供者共同拥有新浪网站内相关内容(包括但不限于文字、图片、音频、视频资料及页面设计、编排、软件等)的版权和/或其他相关知识产权。“新浪网”、“sina”为新浪公司及其关联公司的注册商标,受中国法律保护。\n\n\n除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\n\n\n违反上述声明而给新浪公司造成损失的,新浪公司将依法追究其法律责任。\t", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "网易公司提供的内容包括但不限于:非用户上传/提供的文字、软件、图片、音频、视频、图表、程序代码、界面设计、版面框架、数据资料、账号等,所有这些内容的知识产权及相关智力成果的权利均属于网易公司,并受版权、商标、专利和其它相关法律的保护。未经网易公司授权,用户不得使用上述内容,并且用户未经许可,不得对上述内容进行包括但不限于复制、销售、重制、再创作等行为。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data25.json b/sigs/datacompliance/merged_data25.json new file mode 100644 index 0000000000000000000000000000000000000000..c57bd7d5e47b7fbe07c067e8ea44edacbade1ada --- /dev/null +++ b/sigs/datacompliance/merged_data25.json @@ -0,0 +1,112 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "9.4 上述及其他任何本服务包含的内容的知识产权均受到法律保护,其他未经百度、用户或相关权利人许可的第三人,不得以任何形式进行使用或创造相关衍生作品。\n\n9.5 您理解并同意,您向任何第三人分享、转发、复制百家号平台信息内容的行为,均应遵守百家号平台为此制定的规范和标准,包括但不限于展示方式应为该信息或内容的原链接、确保附属于该信息或内容的功能可正常使用等。\n\n9.6 任何未经百度书面同意及权利人许可的非法获取行为,均属违法侵权行为。您确认并同意,为及时、有效地保障您基于本服务的合法权益,您特别授权百度在发现您的合法权益(包括但不限于信息网络传播权、著作权等)可能受到侵害时,百度有权以自己的名义或委托专业第三方机构代您向涉嫌侵权的第三人采取法律手段进行维权,特别授权采取的维权手段包括但不限于侵权监控、发函警告、行政举报、提起诉讼、申请仲裁、移送侦查机关处理、调解、和解等。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "网易公司提供的内容包括但不限于:非用户上传/提供的文字、软件、图片、音频、视频、图表、程序代码、界面设计、版面框架、数据资料、账号等,所有这些内容的知识产权及相关智力成果的权利均属于网易公司,并受版权、商标、专利和其它相关法律的保护。未经网易公司授权,用户不得使用上述内容,并且用户未经许可,不得对上述内容进行包括但不限于复制、销售、重制、再创作等行为。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2015 All rights reserved 中国餐饮美食小吃加盟网 版权所有 ", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有:上海问礼信息科技有限公司 ", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2018 Jidianwang.com All Rights Reserved", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "郑重声明:本站作品来源于网络用户上传,完全免费共享。", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright @ 2006 - 2023 学习啦 All Rights Reserved 学习啦 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2000-2023oh100.com版权所有 广州瑞文信息科技有限责任公司 ", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2015-2023 南京蓝鲸人网络科技有限公司", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2007-2023 Houxue.com 版权所有. 江苏厚学网信息技术股份有限公司.", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "万方医学网(http://med.wanfangdata.com.cn)所登载发布的一切内容,包括但不限于文字、图片、音像、图表、标志、标识、广告、商标、域名、软件、程序、版面设计、专栏目录与名称、内容分类标准以及为使用者提供的任何信息,均受《中华人民共和国著作权法》、《中华人民共和国商标法》、《中华人民共和国专利法》等法律法规以及有关国际条约的保护,相应权利由北京万方数据股份有限公司/相关权利人享有。\n\n未经北京万方数据股份有限公司书面授权/相关权利人书面授权,任何人不得将本站所登载、发布的内容及相关服务用于商业性目的,亦不得编辑、转载、链接、复制、发行、传播镜像、进行还原工程、解编或反向组译等本站的部分或全部内容或服务,否则,北京万方数据股份有限公司将依法追究侵权者的法律责任。\n\n本网仅为用户学习、科研提供资料参考,不作为用户疾病诊断、治疗、药品使用、产品采购的依据。如因用户不当使用本网内容造成的任何法律纠纷,北京万方数据股份有限公司/相关权利人均不承担责任。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经北京万方数据股份有限公司及/或相关权利人书面授权,任何人不得将本站所登载、发布的内容及相关服务用于商业性目的,亦不得改动、转载、链接、复制、发行、传播等本站的部分或全部内容或服务,或将之在非本站所属的服务器上作镜像。否则,北京万方数据股份有限公司将依法追究侵权者的法律责任。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "汉斯出版社的期刊作者对其作品享有著作权,所有出版的文章均根据知识共享署名许可协议(CCBY或CC BY-NC)的条款进行出版,该协议允许使用者以任何电子媒介方式非商业性的复制、使用、发表、传播、公开展示作品、制作和发表衍生作品,并保留原作者的署名。", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "1、重庆维普资讯有限公司是《中文科技期刊数据库》的合法拥有者,是维普资讯网及相关网站的合法拥有者,维普资讯网保留运用合法手段维护自身权利的权利。\n2、维普资讯网上传播期刊的相关权利归期刊社所有,基于收录协议中约定的委托,维普资讯网保留运用合法手段维护期刊社权利的权利。\n3、由于历史原因或者技术原因而可能存在的维普资讯网将未签约的期刊错误传播,重庆维普资讯有限公司在维普资讯网上保留相关期刊社的权利,直到相关期刊社通过正规途径向重庆维普资讯有限公司提出权利主张,并按此标准进行相应的补偿。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data3.json b/sigs/datacompliance/merged_data3.json new file mode 100644 index 0000000000000000000000000000000000000000..45ef9211a4b9bf954de28d2606f96cf0244272f3 --- /dev/null +++ b/sigs/datacompliance/merged_data3.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "二 知识产权声明\\n2.1易车提供的网络服务中所包含的任何文字、软件、图片、图形、图表、网页、音频、视频、域名等相关内容均受中国版权、商标及/或其他财产所有权等法律、法规及/或国际公约的保护,对为提供网络服务而使用的任何软件的一切权利均属于该软件的著作权人,未经易车或相关权利人同意,任何人均不得在任何媒体、任何场合直接或间接发布、使用、修改和再使用;易车不对由上述资料产生或在传送、递交全部或部分上述资料,使用相关软件过程中产生的延误、不准确、错误和遗漏或由此产生的任何损害进行赔偿,亦无需以任何形式向用户或任何第三方负责。同时,经易车书面同意进行转载的,转载人应标明相关内容出处及原作者相关信息。\\n\\n2.2易车对用户在使用易车网络服务(包括但不限于口碑、论坛、BBS、)中发布的信息、资讯、文字、图片、图形、图表、音频、视频、软件等(以下简称“内容”)无偿拥有非独家使用权和完全再许可的权利(该等权利不受任何时间和空间的限制),使用范围包括但不限于网站、杂志、期刊、电视、广播等领域。\\n\\n2.3用户在易车网络服务中所发布的内容仅代表用户个人的观点和立场,易车不对此承担任何法律责任及其他责任。\\n\\n2.4易车、易车网及图、车易通、Bitauto及图、等为易车旗下公司拥有的注册商标或商标,均受法律保护。未经易车旗下公司事先书面许可,任何单位及个人不得以任何方式对该等商标的任何部分进行使用、复制、修改、传播、抄录或与其它产品捆绑使用销售。对任何侵犯该等商标权的行为,易车旗下公司保留依法追究其法律责任的权利。\\n\\n2.5鉴于互联网具有海量信息的特点,易车不排除旗下网站(不含互动服务)有极少数作品因客观原因无法联系到权利人。易车将该部分作品的著作权使用费交给相关著作权报酬收转单位代为收转。在此,请相关权利人与易车或者相关报酬收转单位联系,以获得相关报酬。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2013-2023 车主指南 m.icauto.com.cn", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright@2007-2022 All Right Reserved.盖世汽车版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "二 知识产权声明\\n2.1易车提供的网络服务中所包含的任何文字、软件、图片、图形、图表、网页、音频、视频、域名等相关内容均受中国版权、商标及/或其他财产所有权等法律、法规及/或国际公约的保护,对为提供网络服务而使用的任何软件的一切权利均属于该软件的著作权人,未经易车或相关权利人同意,任何人均不得在任何媒体、任何场合直接或间接发布、使用、修改和再使用;易车不对由上述资料产生或在传送、递交全部或部分上述资料,使用相关软件过程中产生的延误、不准确、错误和遗漏或由此产生的任何损害进行赔偿,亦无需以任何形式向用户或任何第三方负责。同时,经易车书面同意进行转载的,转载人应标明相关内容出处及原作者相关信息。\\n\\n2.2易车对用户在使用易车网络服务(包括但不限于口碑、论坛、BBS、)中发布的信息、资讯、文字、图片、图形、图表、音频、视频、软件等(以下简称“内容”)无偿拥有非独家使用权和完全再许可的权利(该等权利不受任何时间和空间的限制),使用范围包括但不限于网站、杂志、期刊、电视、广播等领域。\\n\\n2.3用户在易车网络服务中所发布的内容仅代表用户个人的观点和立场,易车不对此承担任何法律责任及其他责任。\\n\\n2.4易车、易车网及图、车易通、Bitauto及图、等为易车旗下公司拥有的注册商标或商标,均受法律保护。未经易车旗下公司事先书面许可,任何单位及个人不得以任何方式对该等商标的任何部分进行使用、复制、修改、传播、抄录或与其它产品捆绑使用销售。对任何侵犯该等商标权的行为,易车旗下公司保留依法追究其法律责任的权利。\\n\\n2.5鉴于互联网具有海量信息的特点,易车不排除旗下网站(不含互动服务)有极少数作品因客观原因无法联系到权利人。易车将该部分作品的著作权使用费交给相关著作权报酬收转单位代为收转。在此,请相关权利人与易车或者相关报酬收转单位联系,以获得相关报酬。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "四、知识产权\\n1、搜狐服务中包含的任何文字、图表、音频、视频或软件(包括但不限于软件中包含的图表、动画、音频、视频、界面实际、数据和程序、代码、文档)等信息或材料均受著作权法、商标法或其它法律法规的保护,未经相关权利人书面同意,用户不得以任何方式使用该等信息或材料,但出于使用搜狐服务目的而使用的除外。\\n\\n2、本协议未授予用户使用搜狐任何商标、服务标记、标识、域名和其他显著品牌特征的权利。\\n\\n3、除本协议明确允许的以外,用户不得以任何形式或任何方式对搜狐服务部分或全部内容进行修改、出租、租赁、出借、出售、分发、复制、创作衍生品或用于任何商业用途。\\n\\n4、用户在搜狐上发布的信息不得侵犯任何第三人的知识产权,未经相关权利人之事先书面同意,用户不得以任何方式上传、发布、修改、传播或复制任何受著作权保护的材料、商标或属于其他人的专有信息。\\n\\n5、用户同意,对于其上传到本网站的任何内容,搜狐在全世界范围内不限形式和载体地享有永久的、不可撤销的、免费的、非独家的使用权和转授权的权利,包括但不限于修改、复制、发行、展览、改编、汇编、出版、翻译、信息网络传播、广播、表演和再创作及著作权法等法律法规确定的其他权利,用户特别授权搜狐以自己名义单独对第三方的侵权行为提起诉讼并获得全额赔偿。搜狐无须为此向用户给予任何报酬或承担任何义务,也无须另行通知。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有2011|未经授权禁止复制或建立镜像,否则将追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "凡本网注明“来源:中华网”的所有作品,均为北京华网智讯信息有限公司合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:中华网”。违反上述声明者,本网将追究其相关法律责任。\\n\\n凡本网注明“来源:XXX(非中华网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "QQ音乐一直以来都非常重视和尊重他人的知识产权和合法权益,严格遵守知识产权等法律法规,依法保护知识产权权利人和用户的合法权益,为广大用户提供优质正版的网络音乐服务。若您认为您的知识产权或合法权益被侵犯,可书面通知QQ音乐要求删除侵权内容或者断开侵权链接。如果通知人弄虚作假或陈述失实,将需承担因此导致的一切法律责任(包括但不限于赔偿损失、诉讼费、律师费、取证费用等)。如果您不确定相关内容是否侵犯了自己的知识产权和其他合法权益,建议您先咨询相关专业人士。\\n\\n为有效处理您的权利通知,请您认真填写附件1的《要求删除或断开链接侵权网络内容的通知》(具体填写可参考附件2的《要求删除或断开链接侵权网络内容的通知填写说明》),并签字或加盖公章。通过以下两种方式通知我们:\\n\\n1、将前述书面通知及其相关证明材料的纸质版本全部扫描后通过电子邮件发送至QQ音乐指定电子邮箱:qqmusic155@tencent.com\\n\\n2、通过邮寄的方式将前述书面通知书及其相关证明材料的纸质版本邮寄至以下地点:\\n\\n 地址:中国广东省深圳市南山区深圳市南山区科兴科学园D3栋12F 腾讯音乐法务部(收)\\n\\n 邮编:518057\\n\\n注:权利通知人应保证提交的通知文件的真实性和合法性,并自行承担由此造成的全部法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2022 All rights reserved. 上海虫虫音乐文化有限公司", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "网站相关- 商务合作信箱: www@9ku.com<音乐传邮箱: smm@9ku.com>本站声明·本站音乐 本站歌曲 内容搜索自互联网和网友上传,只做在线试听,不提供 MP3下载;好听的歌不提供下载及不提供任何下载链接,档案仅作低品质试听,本站充分的认识到保护音乐版权的重要性:由于音乐来自网友通过共享上传,本站未及一一审核,如有侵犯版权请及时电邮并出示版权证明,我们将在24小时内删除。本站充分的认识到保护音乐版权的重要性。为更好的保护歌曲著作人权益,保护发行人的利益,在防止拷贝、下载做了努力。本站已经和数百家唱片公司内容合作,并获得书面授权,欢迎需要在本站推广告音乐的唱片公司与我们联系。把歌曲授权给本站:我们不提供任何音乐本地下载,同时我们也希望网友们更好的、健康的认识到尊重著作人的必要性,支持正版听你想听的9KU音乐,经典9KU音乐在线试听,九酷歌曲展现流行经典! 9KU音乐,9KU经典;九酷音乐网唯一网址: www.9ku.com。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "一 听音乐网绝大多数歌曲拥有权利人授权。但是由于部分音乐来自网友上传和搜索引擎,本站未及一一审核,同时由于信息的不对称,在我们在逐步建立一个版权清晰 的曲库上有一定难度,所以在这里本站也再次重申,若任何第三方声称是任何音乐作品的版权拥有者,请及时联系我们。我们会尽一切所能在最大范围内保证版权人 行使权利,保护版权人的合法利益。\\n \\n\\n一听音乐网由衷地认识到知识产权是人类社会的重要财富,一听愿与所有音乐权利人共同耕耘。\\n \\n\\n联系邮件:ytingmusic@163.com", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "一、知识产权\\n1. 豆瓣网注册用户(以下简称“用户”)发布在豆瓣网的原创文章、评论、图片等内容的知识产权均归用户本人所有。 2. 用户通过转载、复制、截图等方式获取他人内容,并发布在豆瓣网的,相关内容的知识产权属于内容的权利人,用户不得侵犯他人知识产权及其他合法权利。因用户发布内容引发知识产权纠纷的,用户须自行承担相应后果,若因此造成豆瓣损失的,豆瓣有权依照法律规定维护合法权益。 3. 豆瓣网展示的豆瓣标识、版面设计、排版方式、文本、图片、图形等受著作权法、商标法、专利法及其他法律保护的部分,未经豆瓣书面同意,不得进行任何形式的发布、改编、修改,或其他商业及非商业性使用。 4. 豆瓣不对用户发布内容的知识产权权属进行保证,并且尊重权利人的知识产权及其他合法权益。若权利人认为用户发布的内容侵犯自身的知识产权或其他合法权益,可依法向豆瓣发出书面通知(《豆瓣侵权投诉指引》),通知应当包括构成侵权的初步证据及权利人的真实身份信息。豆瓣接到投诉人符合法定条件的投诉及材料后,将会根据相关法律规定及时进行处理。 在符合法律要求的前提下,豆瓣会将投诉人的投诉材料转送给相关用户。用户可以向豆瓣提交不存在侵权行为的声明,声明应当包括不存在侵权行为的初步证据及用户的真实身份信息。豆瓣亦会依照法律规定进行处理,且在符合法律要求的前提下,豆瓣会将用户提交的声明转送给投诉人。\\n\\n5. 豆瓣鼓励原创,并尽最大努力为用户自主创作并发布于豆瓣网的内容提供保护,用户可在发表日记、长评、相册等内容时开启原创内容版权声明。如用户发布的原创内容遭受来自第三方平台或其用户的侵犯,用户可通过“豆瓣站外侵权投诉通道”(目前仅支持部分平台)进行维权。豆瓣可以在获得用户授权后协助用户维权。豆瓣的维权权利不影响用户另行授权第三方维权。豆瓣收到用户撤销授权的通知后,将停止维权。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "6. 知识产权\\n除非另有约定或我方另行声明,我方平台所有:产品外观、网站图片、技术、软件、数据等其他信息,未经相关权利人同意,上述资料均不得在任何媒体直接或间接发布、播放、出于播放或发布目的而改写或再发行,或者被用于其他任何商业目的。所有这些资料或资料的任何部分仅可作为私人和非商业用途而保存在某台计算机内。我方不就由上述资料产生或在传送或递交全部或部分上述资料过程中产生的延误、不准确、错误和遗漏或从中产生或由此产生的任何损害赔偿,以任何形式,向用户或任何第三方负责。\\n\\n如您在使用我方平台提供的服务的过程中遇到其它用户的辱骂、侮辱行为,可直接点击\"举报\"按键进行举报,相关人员会尽快核实并进行处理。如用户认为该用户的言论与事实不符,给自己的名誉权及社会评价造成了负面影响,请尽快向司法机关寻求帮助,我方将依法配合司法机关的调查取证工作。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "酷我音乐一贯高度重视知识产权保护并遵守中国各项知识产权法律、法规和具有约束力的规范性文件。由于酷我音乐来自用户通过网络共享,对非法转载,盗版等侵权行为的发生不具备充分的监控能力,所以,若您认为您的知识产权或合法权益被侵犯,可书面通知酷我音乐要求删除侵权内容或者断开侵权链接。酷我音乐将根据相关法律规定采取措施移除相关内容或屏蔽相关链接。\\n为有效保护您的合法权利,请参考《《要求删除或断开链接侵权网络内容的通知》填写说明》填写《要求删除或断开链接侵权网络内容的通知》。请您在该权利通知落款处亲笔签名,如果您是依法成立的机构或组织,请您加盖公章。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "生活网 © 版权所有 ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "知识产权声明\\n19楼拥有19楼互联网社区网站内的所有合法信息内容(包括但不限于文字、图片、软件、音频、视频)的著作权。\\n任何未被授权的浏览、复制、打印和传播属于19楼互联网社区的信息内容,都不得用于商业目的,且所有信息内容及其任何部分的使用都必须包括此版权声明;已经书面授权的,应在授权范围内使用,并注明\"来源:19楼互联网社区\"。违反上述声明者,以侵权论,19楼可以其自己的名义主张权利,包括但不限于提出交涉、投诉、向人民法院提起诉讼等,将依法追究其相关法律责任。\\n19楼互联网社区的所有产品、技术与所有程序均属于19楼的知识产权。 \"19楼\"及其他服务名称及相关图形、标识等为19楼的注册商标。未经19楼许可,任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载等方式)使用。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "八、知识产权\\n8.1 公司在本服务中提供的内容(包括但不限于软件、技术、程序、网页、文字、图片、图像、音频、视频、图表、版面设计、电子文档等)的知识产权属于公司所有。公司提供本服务时所依托的软件的著作权、专利权及其他知识产权均归公司所有。未经公司许可,任何人不得擅自使用(包括但不限于通过任何机器人、蜘蛛等程序或设备监视、复制、传播、展示、镜像本服务中的内容)。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "12. 禁止商业行为\\n\\n您同意不对本服务任何部分或本服务之使用或获得,进行复制、拷贝、出售、转售或用于任何其它商业目的。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data4.json b/sigs/datacompliance/merged_data4.json new file mode 100644 index 0000000000000000000000000000000000000000..11cb3bc468580fbfc71faee95825e2fcc100211f --- /dev/null +++ b/sigs/datacompliance/merged_data4.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "12. 禁止商业行为\\n\\n您同意不对本服务任何部分或本服务之使用或获得,进行复制、拷贝、出售、转售或用于任何其它商业目的。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "百度拥有本网站内所有资料的版权,各分频道权利声明有特殊规定的,从其规定。任何被授权的浏览、复制、打印和传播属于本网站内的资料必须符合以下条件:\\n\\n所有的资料和图象均以获得信息为目的;\\n所有的资料和图象均不得用于商业目的;\\n所有的资料、图象及其任何部分都必须包括此版权声明;\\n本网站(www.baidu.com)所有的产品、技术与所有程序均属于百度知识产权,在此并未授权。“Baidu”、 “百度”及相关图形等为百度的注册商标。\\n\\n未经百度许可,任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载)使用,或通过非常规方式(如:恶意干预百度数据)影响百度的正常服务,任何人不得擅自以软件程序自动获得百度数据。否则,百度将依法追究法律责任。\\n", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "十四、网络服务内容的所有权\\n\\n企查猫定义的网络服务内容包括:文字、终端、声音、图片、录象、图表、广告中的全部内容;电子邮件的全部内容;企查猫为用户提供的其他信息。所有这些内容受版权、商标、标签和其它财产所有权法律的保护。所以,用户只能在企查猫和广告商授权下才能使用这些内容,而不能擅自复制、再造这些内容、或创造与内容有关的派生产品。企查猫所有的文章版权归原文作者和企查猫共同所有,任何人需要转载企查猫的文章,必须征得原文作者或企查猫授权。我们的服务方式适应于通过电话线拨号上网(或者其他方式)接入INTERNET。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权声明:\\n凡本网注明“来源:报告大厅”的所有作品,版权均属于中国报告大厅网,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明\"来源:报告大厅网\"。违反上述声明者,本网将追究其相关法律责任。 凡本网注明“来源:XXX(非中国报告大厅网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的。 联系方式: +86-10-58247072", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "律师声明\\n为维护自身合法权益,分析测试百科网授权本律师声明如下:\\n\\n本网站所有的信息,包括但不限于文字、图片及其他资源,均受到《中华人民共和国著作权法》及相关法律法规和国际条约的保护;上述内容的知识产权属于本公司,或其他授权公司用于网站使用的内容提供者。\\n任何单位或个人使用本网站的信息,必须获得分析测试百科网授权,未经授权许可,不得转载或镜像,否则本律师将根据当事人的委托追究其法律责任。\\n对于引用他人的信息,本网站均已经列明出处。我们转载的目的在于学术交流与讨论,如果您认为我们的转载侵犯了您的权益,请与我们联系,我们将在3个工作日内删除相关内容。\\n本网站文章仅代表作者本人的观点,与本网站立场无关,作者文责自负。\\n本网站所刊载的文章、图片、资料及价格信息等仅供参考使用。本网站所刊载的内容,并不代表同意其说法或描述,仅为提供更多信息,也不构成任何学术建议。任何依据本网站信息所做的决定均由其本人负责。\\n其他任何未尽事宜,请与本律师联系。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "optyright © 2009-2023 17house.com,All rights reserved. 北京一起网科技股份有限公司", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2009-2023 spzs.com. All Rights Reserved. ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "1、版权:\\nA、此网址的所有内容和图表受《中华人民共和国著作权法》及相关法律法规和中国加入的所有知识产权方面的国际条约的保护。丁香通网站(http://www.biomart.cn,以下简称丁香通)对网站内容享有完整的著作权,未经其允许,不得以任何形式复制和采用。\\n\\nB、 请勿擅自复制或采用丁香通所创造的用以制成网页的HTML。丁香通对其html享有著作权。同时丁香通对其网址上的所有图 标、图饰、图表、色彩、文字表述及其组合、版面设计、数据库均享有完全的著作权,对发布的信息均享有专有的发布和使用权,未经丁香通同意,不得 擅自复制、使用或转载。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有:上海玄霆娱乐信息科技有限公司 网络出版服务许可证编号:(署)网出证沪字第055号", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2023 阅文集团版权所有\\n\\n网络文化经营许可证:沪网文【 2023 】0374-020号", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright By 晋江文学城 www.jjwxc.net All rights reserved\\nProcessed in 0.00 second(s) 最后生成2023-11-20 06:28:51\\n违规内容投诉/未成年投诉热线400-870-5552,短信投诉发15300292289,投诉邮箱help@jjwxc.com,欢迎网监部门直接致电通知删除违规内容\\n本站作品(专栏、小说、评论、贴子等)版权均为原创者所有,本站仅提供上传、存储及展示功能。本站所收录、展示内容及广告仅代表创作者观点,与本站立场无关。\\n请所有用户发布内容时严格遵守国家相关法律法规。我们拒绝任何色情暴力及其他违规内容,一经发现,立即删除,严重者将同时封禁账号。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1999-2023 www.hongxiu.com All Rights Reserved版权所有 北京红袖添香科技发展有限公司。本站所收录的作品、社区话题、用户评论、用户上传内容或图片等均属用户个人行为。如前述内容侵害您的权益,欢迎举报投诉,一经核实,立即删除,本站不承担任何责任", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "出版物经营许可证 京出发京批字第直110071", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright (C) 2006-2022 www.17k.com All Rights Reserved 中文在线版权所有, 都市小说、 仙侠武侠、 言情小说等在线小说阅读网站,未经许可不得擅自转载本站内容。\\n17K小说网所收录免费小说作品、社区话题、书友评论、用户上传文字、图片等其他一切内容均属用户个人行为,与17K小说网无关。--17K权利声明。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "6.1.1未经爱奇艺明确授权,以商业性或其他非个人使用等目的为自己或他人获取、使用本服务\\n6.1.2 未经爱奇艺明确授权,通过机器人软件、蜘蛛软件、爬虫软件等任何自动程序、脚本、软件等方式获取本服务、内容、数据\\n6.1.3未经爱奇艺明确授权,通过技术手段对服务内容、服务期限、消费金额、交易状态等信息进行修改;\\n6.1.4将本服务通过非爱奇艺明确授权的方式在爱奇艺账号之间转移,或未经爱奇艺明确授权而赠与、借用、租用、销售、转让本服务部分或全部内容\\n6.1.5未经爱奇艺明确授权,将本服务提供的部分或全部内容进行复制、下载、上传、修改、编目排序、翻译、发行、开发、转让、销售、展示、传播、合成、嵌套、链接、创作衍生作品、进行商业开发或推广等\\n6.1.6对爱奇艺用于保护本服务的任何安全措施技术进行破解、更改、反操作、篡改或其他破坏,未经爱奇艺事先书面同意而删除本服务内容上的任何所有权或知识产权声明或标签\\n6.1.7 未经爱奇艺明确授权,采用收费或免费的方式,在任何公开场合全部或部分展示本服务内容(但如用户的上述行为不构成侵权的除+G76外) ;\\n6.1.8通过不正当手段或以违反诚实信用原则的方式(如利用规则漏洞、利用系统漏洞、滥用会员身份、黑色产业、投机等违背爱奇艺提供服务的初衷的方式);\\n6.1.9通过侵犯爱奇艺或他人合法权益的方式\\n6.1.10其他未经爱奇艺明示授权许可或违反本协议、法律法规或监管政策的行为", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright By 晋江文学城 www.jjwxc.net All rights reserved\\nProcessed in 1,700,128,109.22 second(s) 最后生成2023-11-16 17:48:29\\n违规内容投诉/未成年投诉热线400-870-5552,短信投诉发15300292289,投诉邮箱help@jjwxc.com,欢迎网监部门直接致电通知删除违规内容\\n本站作品(专栏、小说、评论、贴子等)版权均为原创者所有,本站仅提供上传、存储及展示功能。本站所收录、展示内容及广告仅代表创作者观点,与本站立场无关。\\n请所有用户发布内容时严格遵守国家相关法律法规。我们拒绝任何色情暴力及其他违规内容,一经发现,立即删除,严重者将同时封禁账号。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright(C) 2008-2021 www.tadu.com All Rights Reserved 版权所有 北京易天新动网络科技有限公司 塔读小说版权所有,未经许可不得转载", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权归纵横文学旗下纵横中文网所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data5.json b/sigs/datacompliance/merged_data5.json new file mode 100644 index 0000000000000000000000000000000000000000..4251a86f04f84a85620202ceee943950a5c9fa04 --- /dev/null +++ b/sigs/datacompliance/merged_data5.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2006-2023unjs.com版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright By 晋江文学城 www.jjwxc.net All rights reserved\\nProcessed in 1,700,128,109.22 second(s) 最后生成2023-11-16 17:48:29\\n违规内容投诉/未成年投诉热线400-870-5552,短信投诉发15300292289,投诉邮箱help@jjwxc.com,欢迎网监部门直接致电通知删除违规内容\\n本站作品(专栏、小说、评论、贴子等)版权均为原创者所有,本站仅提供上传、存储及展示功能。本站所收录、展示内容及广告仅代表创作者观点,与本站立场无关。\\n请所有用户发布内容时严格遵守国家相关法律法规。我们拒绝任何色情暴力及其他违规内容,一经发现,立即删除,严重者将同时封禁账号。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright By 晋江文学城 www.jjwxc.net All rights reserved\\nProcessed in 1,700,128,109.22 second(s) 最后生成2023-11-16 17:48:29\\n违规内容投诉/未成年投诉热线400-870-5552,短信投诉发15300292289,投诉邮箱help@jjwxc.com,欢迎网监部门直接致电通知删除违规内容\\n本站作品(专栏、小说、评论、贴子等)版权均为原创者所有,本站仅提供上传、存储及展示功能。本站所收录、展示内容及广告仅代表创作者观点,与本站立场无关。\\n请所有用户发布内容时严格遵守国家相关法律法规。我们拒绝任何色情暴力及其他违规内容,一经发现,立即删除,严重者将同时封禁账号。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1999-2023 www.hongxiu.com All Rights Reserved版权所有 北京红袖添香科技发展有限公司", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "孔夫子旧书网拥有本网站内所有信息内容(除孔夫子旧书网会员发布的商品信息外,包括但不限于文字、图片、软件、音频、视频)的版权。\\n\\n任何被授权的浏览、复制、打印和传播属于本网站内信息内容都不得用于商业目的且所有信息内容及其任何部分的使用都必须包括此版权声明;\\n\\n孔夫子旧书网(www.kongfz.com)所有的产品、技术与所有程序均属于孔夫子旧书网知识产权。\"kongfz\"\"孔夫子旧书网\"、其他产品服务名称及相关图形、标识等为孔夫子旧书网的注册商标。未经孔夫子旧书网许可,任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载)使用。否则,孔夫子旧书网将依法追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright (C) 2006-2022 www.17k.com All Rights Reserved 中文在线版权所有, 都市小说、 仙侠武侠、 言情小说等在线小说阅读网站,未经许可不得擅自转载本站内容。\\n17K小说网所收录免费小说作品、社区话题、书友评论、用户上传文字、图片等其他一切内容均属用户个人行为,与17K小说网无关。--17K权利声明。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "知识产权声明\\n孔夫子旧书网拥有本网站内所有信息内容(除孔夫子旧书网会员发布的商品信息外,包括但不限于文字、图片、软件、音频、视频)的版权。\\n\\n任何被授权的浏览、复制、打印和传播属于本网站内信息内容都不得用于商业目的且所有信息内容及其任何部分的使用都必须包括此版权声明;\\n\\n孔夫子旧书网(www.kongfz.com)所有的产品、技术与所有程序均属于孔夫子旧书网知识产权。\"kongfz\"\"孔夫子旧书网\"、其他产品服务名称及相关图形、标识等为孔夫子旧书网的注册商标。未经孔夫子旧书网许可,任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载)使用。否则,孔夫子旧书网将依法追究法律责任。\\n", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "AllRights Reserved版权所有 北京创阅科技有限公司", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "用户在下厨房发布的菜谱、作品、图片、文字等内容,著作权均归本人所有。\\n用户不得将侵犯他人的专利、商标、著作权、商业秘密或其他专属权利之内容进行上载、张贴或以其他方式发布在下厨房;用户自行发布或者授权他人在下厨房平台发表的全部内容,授予下厨房免费的、不可撤销的、非独家使用许可,用于下厨房相关的产品和服务上,包括但不限于网站、手机客户端或其他互联网产品,下厨房将在显著位置标注作者信息。\\n标有「独家」选项的菜谱,用户如果需要同时发布在其他互联网平台,需要得到下厨房的许可,否则视为侵权,下厨房保留对这些内容的处理权力,包括但不限于取消「独家」标识、屏蔽(不出现公共区域,包括但不限于榜单、分类里)、删除,请自行做好内容备份。\\n第三方出于非商业目的,将用户在下厨房上发表的内容进行转载,应该在显著位置注明原作者信息以及「来源于下厨房」、给出原始链接,并且不允许对内容进行修改演绎。(如用户在内容里表达拒绝任何形式的转载,以用户的版权声明为准)\\n用户需要对上传的图片、文字等内容的版权负责,下厨房不承担因此带来的任何第三方责任以及法律风险。\\n对于第三方侵犯下厨房用户的相关权益,在用户的同意和授权下,下厨房保留对该第三方提出警告、诉讼的权利。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 © 2004-2023 北京盛世传越科技有限公司 保留所有权利 除该菜谱及其它内容上载的用户所享有的版权,未经美食天下明示授权许可,其他用户不得进行修改、出租、散布或衍生其他作品。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "食品科技网 版权所有©1999-2022 TECH-FOOD.COM ALL RIGHTS RESERVED.未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:食品科技网”。违反上述声明者,本网将追究其相关法律责任。 凡本网注明“来源:XXX(非食品科技网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "用户不得自行或许可任何第三方对“豆果美食”软件及相关服务复制、修改、出售或衍生产品。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright2014-2020© 卡饭网", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "我们的产品中明确标注为果壳发布或者原创的内容,其知识产权归属于果壳所有、或者我们已获得权利人的合法授权。用户在使用本服务中所产生的内容的知识产权归用户或相关权利人所有。未经权利人同意,您不得以任何形式使用前述内容,否则因此产生的法律责任由您自行承担。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2004-2023博客园保留所有权利", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 环球时报在线(北京)文化传播有限公司 版权所有 用户只能在环球网和相关权利人授权下才能使用这些内容,而不能擅自复制、发布、转载、播放、改编、汇编或以其他方式使用这些内容或将该等内容用于其他任何商业目的。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2011-2023 SegmentFault. SegmentFault 为用户提供“保留所有权利,禁止转载”的选项。除非获得原作者的单独授权,任何第三方不得转载标注了“禁止转载”的内容,否则均视为侵权。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data6.json b/sigs/datacompliance/merged_data6.json new file mode 100644 index 0000000000000000000000000000000000000000..050f72d445e374baaf95101213e4e46c91f1746e --- /dev/null +++ b/sigs/datacompliance/merged_data6.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright @ 2007-2023 中国科学报社 All Rights Reserved 凡本网注明“来源:科学网”或“中国科学报”的文字、图片和音、视频作品,版权均属科学网所有,任何媒体、网站或个人未经本网书面授权不得转载、链接、转贴或以其他方式使用;已经有本网书面授权的,在使用时必须注明“来源:科学网”", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996 - 2023 SINA Corporation, All Rights Reserved 未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "1997-2023 版权所有 Copyright(C)Mydrivers.com, All Rights Reserved.", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright2014-2020©卡饭网", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2023 稀土掘金 除非得到公司事先书面授权,您不得以任何形式对“稀土掘金”及相关服务进行包括但不限于改编、复制、传播、垂直搜索、镜像或交易等未经授权的访问或使用。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "CoolShell.cn © 2023 除非文章内特别说明,你可以转载酷壳的文章,但请加入文章作者和出处。谢谢。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright @ 2007-2023 中国科学报社 All Rights Reserved 凡本网注明“来源:科学网”或“中国科学报”的文字、图片和音、视频作品,版权均属科学网所有,任何媒体、网站或个人未经本网书面授权不得转载、链接、转贴或以其他方式使用;已经有本网书面授权的,在使用时必须注明“来源:科学网”", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经东方财富或相关权利人事先书面许可,任何人不得将本网站上的任何内容以任何方式进行复制、修改、转载、传播、经销、翻印、演示、出版或任何其它形式的散发。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经东方财富或相关权利人事先书面许可,任何人不得将本网站上的任何内容以任何方式进行复制、修改、转载、传播、经销、翻印、演示、出版或任何其它形式的散发。", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "CopyRight 2000 CFl, Inc. All Rights Reserved", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权声明©2023 盖德化工网 第三方若出于非商业目的,将用户在盖德问答上发表的内容转载在盖德问答之外的地方,应当在作品的正文开头的显著位置注明原作者姓名(或原作者在盖德问答上使用的帐号名称),给出原始链接,注明「发表于盖德问答」,并不得对作品进行修改演绎。若需要对作品进行修改,或用于商业目的,第三方应当联系用户获得单独授权,按照用户规定的方式使用该内容。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996-2020 IASK Corporation,All Right Reserved 用户从新浪爱问的服务中获得的信息在没有得到事先许可的情况下,个人或提供给第三方利用复制,发送,传播等手段用于盈利目的时,将追究相关当事人的法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经公司书面许可,您不得自行或授权、允许、协助任何第三人对本协议查字典平台服务中信息内容进行如下行为:(1)复制、读取、采用查字典服务的信息内容,用于包括但不限于宣传、增加阅读量、浏览量等商业用途;", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2023 猫眼电影 www.maoyan.com 未经本平台事先书面许可,您不应自行或授权、协助任何第三方采用任何未经本平台认可的程序、软件、引擎、爬虫或者其他非正常浏览等技术手段抓取本平台所展示的任何内容(无论该等内容是否由您本人发表或传播)", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data7.json b/sigs/datacompliance/merged_data7.json new file mode 100644 index 0000000000000000000000000000000000000000..32650017066553c628448a849dde581c9fb82f67 --- /dev/null +++ b/sigs/datacompliance/merged_data7.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2005-2023 douban.com, all rights reserved 豆瓣网展示的豆瓣标识、版面设计、排版方式、文本、图片、图形等受著作权法、商标法、专利法及其他法律保护的部分,未经豆瓣书面同意,不得进行任何形式的发布、改编、修改,或其他商业及非商业性使用。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2023 猫眼电影 www.maoyan.com 未经本平台事先书面许可,您不应自行或授权、协助任何第三方采用任何未经本平台认可的程序、软件、引擎、爬虫或者其他非正常浏览等技术手段抓取本平台所展示的任何内容(无论该等内容是否由您本人发表或传播)", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2023 猫眼电影 www.maoyan.com 未经本平台事先书面许可,您不应自行或授权、协助任何第三方采用任何未经本平台认可的程序、软件、引擎、爬虫或者其他非正常浏览等技术手段抓取本平台所展示的任何内容(无论该等内容是否由您本人发表或传播)", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© copyright 2010-2022 值得买科技. All rights reserved. 版权所有 本站内容未经书面许可,禁止一切形式的转载。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任.", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经中国台湾网书面许可,任何人不得引用、复制、转载、摘编或以其他任何方式非法使用中国台湾网的上述内容。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2011-2019 ZAKER.All Rights Reserved", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经授权  严禁转载 Copyright © 2023 JCRB.com Inc. All Rights Reserved.", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2005-2023 版权所有 360公司 个别授权: 未经360事先书面同意并获得书面授权和许可,您不得进行任何商业性的销售、复制、分发,包括但不限于软件销售、预装、捆绑等。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2023 今日头条 除非得到公司事先明示书面授权,你不得以任何形式对“今日头条”软件及相关服务进行包括但不限于改编、复制、传播、垂直搜索、镜像或交易等未经授权的访问或使用。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996-2023 SINA Corporation All Rights Reserved 新浪公司 版权所有 除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\\n\\n", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1998 - 2023 Tencent. All Rights Reserved 腾讯公司对其发行的或与合作伙伴共同发行的作品享有版权,受各国版权法及国际版权公约的保护。\\n对于上述版权内容,超越合理使用范畴、并未经本公司书面许可的使用行为,我公司均保留追究法律责任的权利。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2023 marksmile.com", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©1999-2023清科创业版权所有", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2003-2022 7k7k.com ,除非获得权利人的授权,用户不得转载、修改、传播、制作衍生作品或者商业使用。用户或其他媒体、企业、网站、其他组织或个人对本平台内容如需使用,必须先与作者、相关权利人或本平台联系。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2004-2023 4399.com All Rights Reserved. 四三九九网络股份有限公司 版权所有 除非获得权利人的授权,用户不得转载、修改、传播、制作衍生作品或者商业使用。用户或其他媒体、企业、网站、其他组织或个人对本平台内容如需使用,必须先与作者、相关权利人或本平台联系。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2019-2020 66game.cn 66街机网 未得66街机游戏网的书面允许,任何人不得以各种形式复制、散布、出售、出版、广播、转播66街机游戏网上的相关信息。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2004-2023 TGBUS Corporation, All Rights Reserved 任何传播媒体转载、摘编本网站刊登、发布的作品,必须按有关规定向著作权人或本网站支付报酬并注明出处,且不得超过本网站刊登、转载该作品的范围;著作权人声明或者本网站受著作权人授权声明不得转载、摘编其作品的,任何人不得擅自转载、摘编,否则必须承担一切法律后果。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "CopyRight © 2011-2023 www.nanrenwo.net,All rights reserved. 男人窝 版权所有. 除了授权转载和用户自行分享发布的信息之外拥有版权等知识产权,受法律保护。未经厦门男人尚网络科技有书面授权许可,任何其他个人或组织均不得以任何形式将本网站的各项资源转载、复制、编辑、修改或抄录于其他任何场合;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data8.json b/sigs/datacompliance/merged_data8.json new file mode 100644 index 0000000000000000000000000000000000000000..855b32ce57f9091deb247bc8fc2e18b59c51770d --- /dev/null +++ b/sigs/datacompliance/merged_data8.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2022, All Rights Reserved Powered By www.mum.cc 任何传播媒体转载、摘编本网站刊登、发布的作品,欢迎转载但务必注明来源及作者,需在来源处添加:www.mum.cc 或内页链接;著作权人声明或者本网站受著作权人授权声明不得转载、摘编其作品的,任何人不得擅自转载、摘编,否则必须承担一切法律后果。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 智房网-全球旅游地产导购 北京智房佳业信息技术有限公司 未经权利人许可,任何个人或组织不得对智房网网站内容进行复制、转载、修改、抄袭、剽窃、贩卖、展示、公开、散播或是将其用于任何商业目的。\\n", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "深圳市咚咚互联科技有限公司版权所有,未经同意请勿转载", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2006-2023 yjbys.com版权所有 广州海腾信息科技有限公司 请勿擅自复制或采用应届毕业生网所设计的用以制成网页的脚本语言。应届毕业生网对其脚本语言享有著作权。同时,应届毕业生网对其网站上的所有图标、图饰、图表、色彩、文字表述及其组合、版面设计、数据库均享有完全的著作权,对发布的信息均享有专有的发布和使用权,未经应届毕业生网同意,不得擅自复制、使用或转载。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright◎ 2023 hunt007.com, All Rights Reserved. 未经找工易网站(www.hunt007.com) 同意,不得擅自复制、使用或转载。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无忧工作网版权所有©1999-2023 51job.com 除另有书面声明以外,以上信息和内容的知识产权归51Job所有,未经51Job事先书面同意,不允许全部或部分复制、转载、使用、修改、链接、汇编、发表、抓取或以其他任何方式使用。 ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2022 QBAOBEI.COM ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 @太平洋亲子网 未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "@2023 三优亲子网 版权所有 未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2023 Baidu 用户从宝宝知道的服务中获得的信息在没有得到事先许可的情况下,个人或提供给第三方利用复制,发送,传播等手段用于盈利目的时,将追究相关当事人的法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "齐家网 版权所有Copyright © 2005-2023 www.jia.com All rights reserved 浏览者可以复制、下载本网站上显示的资料,但这些资料不得用于任何商业用途,无论是否在资料上明示,所有此等资料都是受到知识产权的法律保护。浏览者没有获得齐家网(www.jia.com)或各自的版权所有者明确的书面同意下,不得分发、修改、散布、再使用、再传递或使用本网站的内容用于任何公众商业用途。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2012-2023济南六度网络技术有限公司 zxzhijia.com All Rights Reserved 浏览者可以复制、下载本网站上显示的资料,但这些资料不得用于任何商业用途,无论是否在资料上明示,所有此等资料都是受到知识产权的法律保护。浏览者没有获得装修之家网(www.zxzhijia.com)或各自的版权所有者明确的书面授权,不得分发、修改、散布、再使用、再传递或使用本网站的内容用于任何商业用途。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有Copyright ©2023 www.qizuang.com All Rights Reserved 除公共领域可获得的信息或者您已获得我们书面许可的情况外,您不得复制、修改、公布、传播、执行、转载、许可使用、创建衍生作品、转移显示、出售、转售、以非法手段获取或以任何其他方式处置任何齐装网拥有知识产权或所有权的任何信息。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2006-2023 www.chinayigui.com All Rights Reserved 所有资料和资料的汇集均属本网站或本网站的内容提供者或客户的专有财产。未经授权擅自使用任何资料将违反著作权法、商标法和其他适用法律。如果您复制任何资料,您必须在复制件上保留原资料中有关版权、商标、服务标志以及其他专有权的告示。您只能复制一份资料,并且除非这些资料另有具体规定,复制件仅可用在私人、非商业用途。未经本网站事先的书面同意,您不得为了任何公共或商业目的销售或更改资料,或者复制、重制、再版、上载、下载、登载、传送、显示、公开执行或以任何方式发送资料,或将资料存储于检索系统,或以其他任何方式使用资料。\\n", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2006-2023 全屋定制衣柜网 All Rights Reserved 本网站提供的任何内容(包括但不限于数据、文字、图表、图像、声音或录像等)的所有权、著作权及其他权利均属于衣柜网或相关权利人。未经长沙居美网络科技有限公司或相关权利人事先的书面许可,您不得以任何方式擅自复制、再造、传播、出版、转帖、改编、汇编或陈列本网站内容。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2006-2019 唯美村 All rights reserved.凡本网注明“来源:唯美村”的文字、图片,版权均属唯美村女性网所有,任何媒体、网站或个人未经本网书面授权不得转载、链接、转贴或以其他方式使用;已经本网书面授权的,在使用时必须注明“来源:唯美村女性网”。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 @太平洋时尚网 未经授权禁止转载、摘编、复制或建立镜像", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } +] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data9.json b/sigs/datacompliance/merged_data9.json new file mode 100644 index 0000000000000000000000000000000000000000..f2261dc33da40750fe02a53d692004d28bf7903c --- /dev/null +++ b/sigs/datacompliance/merged_data9.json @@ -0,0 +1,102 @@ +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996-2023 SINA Corporation All Rights Reserved 新浪公司 版权所有 除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\\n\\n", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996-2023 SINA Corporation All Rights Reserved 新浪公司 版权所有 除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\\n\\n", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2022虎扑 hupu.com 除非得到虎扑明示事先书面授权,您不得以任何形式改编、复制、传播、垂直搜索、镜像或交易虎扑相关软件或服务。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2015-2019 后台修改文字 版权所有 本站采用创作共用版权 CC BY-NC-SA 3.0 CN 许可协议,转载或复制请注明出处", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2012-2021 上海佰集信息科技有限公司 / 简书 如需进行商业性的销售、复制、分发,包括但不限于软件销售、预装、捆绑等,您必须另行取得我公司的书面授权和许可。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": " © 2005-2023 douban.com, all rights reserved 北京豆网科技有限公司 除法律另有规定外,在未取得豆瓣书面许可前,任何主体不得将豆瓣网的任何公开信息或数据以任何目的进行任何形式的使用,包括但不限于: (1) 商业性使用; (2) 以可能损害豆瓣权益的方式对豆瓣网读书、电影、音乐等条目信息、评分或评论的使用、引用以及展示; (3) 对豆瓣网内容的衍生利用,包括但不限于基于或利用豆瓣网内容而开发的任何插件、软件、应用程序、网站; (4) 以任何形式盗取、拷贝用户账号信息,或采用诱导、要求用户提供账号名称及密码等方式登录用户账号,或对用户主页、ID信息、账号信息的其他使用;或以上述方式取得用户账号登录信息、ID信息、主页信息后,以任何手段复制、转载、抓取豆瓣网内容; (5) 侵犯或可能侵犯豆瓣权益的数据采集、网络爬虫或类似的数据收集以及数据摘录等; (6) 在其他网站、应用程序、服务或商品中使用豆瓣的商标、标识或其他豆瓣专有信息(包括图像、文字、数字、网页设计或形式等); (7) 其他可能侵犯豆瓣合法权益的行为。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996 - 2023 SINA Corporation, All Rights Reserved 未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "好大夫在线版权所有 Copyright 2023 转载或引用医生在好大夫在线上发布的原创作品/内容,应获得医生授权,以显著方式注明医生姓名和医生个人网站链接,并按照法律规定向医生支付稿酬。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中国信鸽协会版权所有 www.crpa.cn 中国信鸽协会官方网站独家发布的所有资料(版面、文字、图片、音视频资料和技术统计数据及软件),未经许可不得转载,经许可转载应标明新闻来源为“中国信鸽协会官方网站”并加上来源的网站链接。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2007- 2023 Boqii.com All Rights Reserved 光橙(上海)信息科技有限公司 版权所有 用户只能在光橙公司和广告商授权下才能使用这些内容,而不能擅自复制、再造这些内容、或创造与内容有关的派生产品。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2007-2021 Boqii.com All Rights Reserved 光橙(上海)信息科技有限公司 版权所有 用户只能在光橙公司和广告商授权下才能使用这些内容,而不能擅自复制、再造这些内容、或创造与内容有关的派生产品。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2000-2023www.ChinaXinge.com All Rights Reserved 未经中信网许可,任何用户、第三方不得自行或授权、允许、协助任何他人对中信网服务中信息内容进行如下行为:\\n\\n (1)复制、读取、采用中信网服务的信息内容,用于包括但不限于宣传、增加阅读量、浏览量等商业用途;\\n\\n (2)擅自编辑、整理、编排中信网服务的信息内容后在中信网的源页面以外的渠道进行展示;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2000-2023www.ChinaXinge.com All Rights Reserved 未经中信网许可,任何用户、第三方不得自行或授权、允许、协助任何他人对中信网服务中信息内容进行如下行为:\\n\\n (1)复制、读取、采用中信网服务的信息内容,用于包括但不限于宣传、增加阅读量、浏览量等商业用途;\\n\\n (3)擅自编辑、整理、编排中信网服务的信息内容后在中信网的源页面以外的渠道进行展示;", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2014 - 2022 最句子 粤ICP备20047785号-2 , All Rights Reserved ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2006-2015 全景统计 如未经著作权人授权用于他处和/或作为他用,著作权人及本站将保留追究侵权者法律责任的权利。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2006-2023 ruiwen.com版权所有", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 中国国家图书馆版权所有 本网站发布的所有自建的或与他人共同开发的信息和内容,包括但不限于标识、图文、音频、视频、网站版式、网页设计等各项内容,除特别注明外,相关作品的著作权均为国家图书馆所有。任何单位或个人未经事先书面许可,均不得将以上内容用于任何商业用途,未经许可用于商业用途或非法目的而侵害我馆合法权益甚至影响我馆声誉的,我馆保留依法追究其法律责任的权利。如需使用相关资料,请提前与我馆相关部门联系(联系邮箱: webmaster@nlc.cn)。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2010 www.lishi.net 版权所有 您的网站或机构从本站获取的一切资源进行商业使用,除来源为本站的资料需与本站协商外,其他资源请自行联系版权所有人。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + } +] \ No newline at end of file